Я хочу скачать этот сайт с wget, и для этого я использую эту команду:
wget.exe --no-clobber --no-parent -r --convert-links --page-requisites -U Mozilla "http://www.s-manuals.com/smd/"
Для меня это нормально, но связанные PDF-файлы находятся в папке на том же уровне, что и мой пример URL:
http://www.s-manuals.com/pdf/datasheet/a/f/afn3400_alpha-mos.pdf
Итак, мне нужно скачать /pdf/
папка тоже. Проблема в том, что если он находится на том же уровне, --no-parent
параметры избегают этого каталога, но если я удалю --no-parent
весь сайт будет загружен, поэтому мне интересно, есть ли опция, которая позволяет мне загружать только эти 2 папки?
Вы можете использовать --include
вариант вместо --no-parent
чтобы указать конкретные каталоги, которые будут включены в загрузку:
wget.exe --no-clobber -I /smd,/pdf -r --convert-links --page-requisites -U Mozilla "http://www.s-manuals.com/smd/"
Увидеть документация по ограничениям на основе каталогов Больше подробностей.