awk -F" " '{ if ( NF == 1 ) { print $0 } }' KINDLE_NOTES_FILE.txt | sed -e '/^=/d' | sed -e '/^[[:space:]]*$/d' -e 's/,//g' | sort | comm -12 List_of_language_words.txt - | uniq
Команда «awk -f» » ‘{ if ( nf == 1 ) { print $0 } }’ kindle_notes_file.txt» выбирает только однословные записи из файла «kindle_notes_file.txt».
Команда «sed -e ‘/^=/d'» удаляет строки, начинающиеся с «=».
Команда «sed -e ‘/^[[:space:]]*$/d’ -e ‘s/,//g'» удаляет пустые строки и удаляет запятые из оставшихся строк.
Команда «sort» сортирует строки в алфавитном порядке.
Команда «comm -12 list_of_language_words.txt -» находит общие строки между файлом «list_of_language_words.txt» и выводом предыдущих команд.
Команда «uniq» удаляет повторяющиеся строки.
Таким образом, команда позволяет получить список одиночных слов из заметок Amazon Kindle 3, исключая строки, начинающиеся с «=», пустые строки и удаляя запятые. Результат сортируется и выводятся только уникальные слова, которые есть и в файле «list_of_language_words.txt».