Как посчитать слова в любом документе OpenOffice (включая презентации Impress)

unzip -p doc.odt content.xml | sed 's|]*>| |g' | wc -l


Команда «unzip -p doc.odt content.xml» извлекает содержимое файла doc.odt (формата OpenOffice) и передает его в следующую команду. Команда «sed ‘s|]*>| |g'» заменяет все HTML теги в тексте на пробелы. Затем, команда «wc -l» считает количество строк в полученном тексте, что дает нам общее количество слов в документе. Альтернативным способом подсчета слов может быть использование программы подсчета слов, такой как «wc -w», которая считает количество слов напрямую, без удаления HTML тегов.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *