awk -F" " '{ if ( NF == 1 ) { print $0 } }' KINDLE_NOTES_FILE.txt | sed -e '/^=/d' | sed -e '/^[[:space:]]*$/d' -e 's/,//g' | sort | comm -12 List_of_language_words.txt - | uniq


Команда «awk -f» » ‘{ if ( nf == 1 ) { print $0 } }’ kindle_notes_file.txt» выбирает только однословные записи из файла «kindle_notes_file.txt».

Команда «sed -e ‘/^=/d'» удаляет строки, начинающиеся с «=».

Команда «sed -e ‘/^[[:space:]]*$/d’ -e ‘s/,//g'» удаляет пустые строки и удаляет запятые из оставшихся строк.

Команда «sort» сортирует строки в алфавитном порядке.

Команда «comm -12 list_of_language_words.txt -» находит общие строки между файлом «list_of_language_words.txt» и выводом предыдущих команд.

Команда «uniq» удаляет повторяющиеся строки.

Таким образом, команда позволяет получить список одиночных слов из заметок Amazon Kindle 3, исключая строки, начинающиеся с «=», пустые строки и удаляя запятые. Результат сортируется и выводятся только уникальные слова, которые есть и в файле «list_of_language_words.txt».

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *