curl -s -O http://s3.amazonaws.com/alexa-static/top-1m.csv.zip ; unzip -q -o top-1m.csv.zip top-1m.csv ; head -1000 top-1m.csv | cut -d, -f2 | cut -d/ -f1 > topsites.txt
Эта команда состоит из нескольких шагов:
1. curl -s -o http://s3.amazonaws.com/alexa-static/top-1m.csv.zip
— загружает файл top-1m.csv.zip
с удаленного сервера http://s3.amazonaws.com/alexa-static/. Опция -s
означает «молчаливый режим», то есть без вывода лишней информации.
2. unzip -q -o top-1m.csv.zip top-1m.csv
— извлекает файл top-1m.csv
из архива top-1m.csv.zip
. Опция -q
означает «тихий режим» без вывода информации о процессе, а -o
перезаписывает файл при необходимости без предупреждений.
3. head -1000 top-1m.csv
— выбирает первые 1000 строк из файла top-1m.csv
. Каждая строка представляет собой запись об одном сайте.
4. cut -d, -f2
— разделяет каждую строку по запятой и выбирает второе поле. В данном случае, это будет поле с url-адресом сайта.
5. cut -d/ -f1
— разделяет url-адрес по символу слэша и выбирает первую часть. Это позволяет получить только основное доменное имя сайта.
6. > topsites.txt
— перенаправляет результат в файл topsites.txt
. Знак >
означает запись результатов в файл, при этом файл будет перезаписан, если он уже существует.
В результате выполнения этой команды будет создан файл topsites.txt
, в котором содержится список основных доменных имен топ-1000 сайтов согласно рейтингу Alexa.