Анализ сжатых журналов доступа Apache для наиболее часто запрашиваемых страниц

zcat access_log.*.gz | awk '{print $7}' | sort | uniq -c | sort -n | tail -n 20


Эта команда анализирует сжатые журналы доступа Apache и выводит 20 наиболее часто запрашиваемых страниц.

zcat access_log.*.gz распаковывает сжатые журналы.
awk '{print $7}' извлекает седьмой столбец (URL страницы) из каждой строки.
sort сортирует URL страниц.
uniq -c подсчитывает количество уникальных URL.
sort -n сортирует по числу запросов.
tail -n 20 выводит последние 20 строк, то есть 20 наиболее часто запрашиваемых страниц.

Альтернативы: Можно использовать zgrep вместо zcat и grep, если журналы доступа были сжаты с использованием gzip.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *