wget -erobots=off --user-agent="Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.3) Gecko/2008092416 Firefox/3.0.3" -H -r -l2 --max-redirect=1 -w 5 --random-wait -PmyBooksFolder -nd --no-parent -A.pdf http://URL


Команда wget используется для загрузки файлов из интернета в терминале. В данной строке команда загружает PDF файлы с сайта и сохраняет их в папку myBooksFolder. Опции -erobots=off и —user-agent позволяют обойти ограничение на загрузку файлов, которые могут запрещены для загрузки роботами. Опцией -r запускается рекурсивная загрузка с опцией -l, которая ограничивает уровень загрузки до двух страниц. Опция -w определяет интервал между запросами в секундах, а —random-wait задает случайную задержку между запросами. Включая опцию -H, вы загрузите файлы, которые лежат на других серверах, а открытые в оригинале страницы будут также загружены с помощью опции -nd. Опция —no-parent ограничивает загрузку только на указанную страницу, исключая другие страницы на том же уровне. Если вы хотите загрузить бесплатные электронные книги, вам нужно указать URL сайта, который предоставляет бесплатные электронные книги в формате PDF. Если вы не можете использовать wget, можно воспользоваться веб-браузером для загрузки файлов.

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *