Как мне проверить мой сайт на наличие мертвых ссылок? Я использовал некоторые подходящие веб-утилиты, например:
Раньше я пользовался некоторыми бесплатными приложениями, например Ксену.
Мне бы очень хотелось что-то, что могло бы экспортировать отчеты в формате, с которым я мог бы что-то делать, например CSV или XML. Что ты используешь?
У меня есть машина Linux, на которой есть задание cron, которое запускает проверку ссылок, чтобы отправить мне отчет.
http://wummel.github.io/linkchecker/
Если вы используете Ubuntu, он находится в диспетчере пакетов.
sudo aptitude install linkchecker
man linkchecker
Вариантов много. У меня хорошо работает. Можно сохранять отчет в различных форматах.
Я буду голосовать за Ксену. Сногсшибательная скорость и множество других функций.
Инструментарий IIS SEO отлично подходит для этого. Он делает гораздо больше, чем просто поиск неработающих ссылок. http://www.iis.net/extensions/SEOToolkit
вы можете создавать отчеты с данными, а также отслеживать отчеты с течением времени.
Я не пробовал это, но я столкнулся с этим вчера вечером, когда пытался превзойти wget, чтобы сделать что-то еще. Может быть, а может и не быть полезным в вашем случае.
--spider
When invoked with this option, Wget will behave as a Web spider,
which means that it will not download the pages, just check that
they are there. For example, you can use Wget to check your book‐
marks:
wget --spider --force-html -i bookmarks.html
This feature needs much more work for Wget to get close to the
functionality of real web spiders.
Я лично выбрал бы анализаторы журналов на стороне сервера для постоянного мониторинга мертвых ссылок. Webalizer / Awstats и, возможно, другие инструменты могут предоставить вам отчет о любых ошибках 404 Not Found, проанализировав журнал вашего веб-сервера.
Преимущество этого подхода: вы также обнаруживаете неверные ссылки на ваш сайт, которые могут быть размещены на каком-либо другом сайте, опечатки пользователей и т. Д. И это непрерывный мониторинг, а не только один раз, когда вы запускаете какую-нибудь проверку мертвых ссылок.
Вы можете комбинировать это с программным обеспечением для зеркалирования веб-сайтов, например httrack. Просто дайте ему просканировать ваш сайт, а затем получите отчет от одного из инструментов анализа журналов.
Есть также некоторые настольные приложения, которые могут анализировать файлы журнала apache и отображать любые ошибки 404 в красивом отчете.