Cisco публикует Справочник по межсетевым технологиям на своем веб-сайте, но они предоставляют только отдельные главы в формате pdf. Есть ли .pdf всего этого?
На самом деле вы можете просто запустить:
wget -r --no-parent -A "*.pdf" http://www.cisco.com/en/US/docs/internetworking/technology/handbook/ito_doc.html
Которая будет захватывать только PDF-файлы.
Вы можете использовать GPL2 / бесплатную базовую версию pdfsam (PDF Split and Merge) или ghostscript (gs), если в Linux / командной строке (apt-get install ghostscript, если в Ubuntu / Debian, и т. Д., Вероятно, есть RPM, или вы также можете скомпилировать из исходного кода).
Редактировать:
Не могу поверить, что я только что это сделал, но какого черта: вот весь gs cmd, скопируйте и вставьте (и мне лучше получить ответ на это):
gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=Cisco.Internetworking.Technology.Handbook.pdf Intro-to-Internet.pdf Intro-to-LAN.pdf Intro-to-WAN.pdf Bridging-Basics.pdf Routing-Basics.pdf NM-Basics.pdf Ethernet.pdf FDDI.pdf Token-Ring.pdf Frame-Relay.pdf HSSI.pdf ISDN.pdf PPP.pdf SMDS.pdf Dial_up.pdf SDLC-etc.pdf X25.pdf VPN.pdf Voice_Data.pdf wireless.pdf DSL_Dig_Subscr_Ln.pdf Cable.pdf Transparent-Bridging.pdf Mixed-Media-Bridging.pdf Source-Route-Bridging.pdf LAN-Switching.pdf atm.pdf MPLS_Tag-Switching.pdf DLSw.pdf OSI-Protocols.pdf Internet-Protocols.pdf IPv6.pdf XNS.pdf AppleTalk.pdf VINES.pdf IBM-SNA-Protocols.pdf DECnet.pdf Enhanced_IGRP.pdf IBM_SNA_routing.pdf IGRP.pdf IP-Multi.pdf NLSP.pdf OSI-Routing.pdf OSPF.pdf RIP.pdf RSVP.pdf QoS.pdf SMRP.pdf Security.pdf Dir-Enabled_Net.pdf Net_caching.pdf IBM-Net-Mgmt.pdf RMON.pdf SNMP.pdf bgp.pdf Multi-Acc.pdf Tag-Switching.pdf
Я знаю, что это может быть довольно трудоемко, но вы можете загрузить все главы и использовать что-то вроде PDF Merge 1.0 чтобы объединить их всех в одно.
Если вы не можете найти его как один, простой способ получить все главы будет выглядеть примерно так:
wget <yourlink>
while read line; do
echo wget http://www.cisco.com/$line;
done < <(grep -o '/en/US/docs/internetworking/technology/handbook/.*.html' Intro-to-Internet.html | sed 's/html/pdf/')
Я иногда использую варианты из вышеперечисленного, чтобы читать лекции. Если сайт сложный, я могу использовать Perl HTML-парсер. Вам нужно будет немного изменить приведенное выше, вы не хотите публиковать точный код для сканирования сайта.