curl -s -O http://s3.amazonaws.com/alexa-static/top-1m.csv.zip ; unzip -q -o top-1m.csv.zip top-1m.csv ; head -1000 top-1m.csv | cut -d, -f2 | cut -d/ -f1 > topsites.txt


Эта команда состоит из нескольких шагов:

1. curl -s -o http://s3.amazonaws.com/alexa-static/top-1m.csv.zip — загружает файл top-1m.csv.zip с удаленного сервера http://s3.amazonaws.com/alexa-static/. Опция -s означает «молчаливый режим», то есть без вывода лишней информации.

2. unzip -q -o top-1m.csv.zip top-1m.csv — извлекает файл top-1m.csv из архива top-1m.csv.zip. Опция -q означает «тихий режим» без вывода информации о процессе, а -o перезаписывает файл при необходимости без предупреждений.

3. head -1000 top-1m.csv — выбирает первые 1000 строк из файла top-1m.csv. Каждая строка представляет собой запись об одном сайте.

4. cut -d, -f2 — разделяет каждую строку по запятой и выбирает второе поле. В данном случае, это будет поле с url-адресом сайта.

5. cut -d/ -f1 — разделяет url-адрес по символу слэша и выбирает первую часть. Это позволяет получить только основное доменное имя сайта.

6. > topsites.txt — перенаправляет результат в файл topsites.txt. Знак > означает запись результатов в файл, при этом файл будет перезаписан, если он уже существует.

В результате выполнения этой команды будет создан файл topsites.txt, в котором содержится список основных доменных имен топ-1000 сайтов согласно рейтингу Alexa.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *