Я пытаюсь получить зеркальное отображение сайта с помощью wget и обнаружил странное поведение.
Скажем, я зеркалирую внутренний сайт www.example.com следующим образом, все вроде работает нормально:
wget -mkE http://www.example.com
Однако, поскольку мне нужно получить доступ к серверу по IP, а не по имени домена, я пытаюсь использовать:
wget -mkE -D www.example.com --header "Host: www.example.com" http://IPv4_ADDR
Но в этом случае он загружает только первую страницу и закрывается.
любая идея?
Когда вы используете wget с http, единственный способ определить, что еще находится на том же сайте, - это ссылки на извлеченных страницах. В зависимости от того, как были созданы эти ссылки (абсолютные или относительные), при получении через IP-адрес ссылки могут выглядеть как внешние, и в этом случае он не будет следовать по ним.