Назад | Перейти на главную страницу

wget загружает с сайта только определенные папки

Я хочу скачать этот сайт с wget, и для этого я использую эту команду:

wget.exe --no-clobber --no-parent -r --convert-links --page-requisites -U Mozilla "http://www.s-manuals.com/smd/"

Для меня это нормально, но связанные PDF-файлы находятся в папке на том же уровне, что и мой пример URL:

http://www.s-manuals.com/pdf/datasheet/a/f/afn3400_alpha-mos.pdf

Итак, мне нужно скачать /pdf/ папка тоже. Проблема в том, что если он находится на том же уровне, --no-parent параметры избегают этого каталога, но если я удалю --no-parent весь сайт будет загружен, поэтому мне интересно, есть ли опция, которая позволяет мне загружать только эти 2 папки?

Вы можете использовать --include вариант вместо --no-parent чтобы указать конкретные каталоги, которые будут включены в загрузку:

wget.exe --no-clobber -I /smd,/pdf -r --convert-links --page-requisites -U Mozilla "http://www.s-manuals.com/smd/"

Увидеть документация по ограничениям на основе каталогов Больше подробностей.