Назад | Перейти на главную страницу

Что на самом деле делает «поиск и уничтожение» антибота arxiv.org?

В lanl.arxiv.org математическая и научная служба препринтов (ранее известная как xxx.lanl.gov) имеет строгую политику в отношении ботов, игнорирующих его robots.txt, Остерегайтесь роботов. На этой странице есть ссылка с надписью «Нажмите здесь, чтобы запустить автоматический поиск и уничтожение вашего сайта», что запрещено их robots.txt но предположительно плохо себя ведающие роботы последуют за ним и пожнут последствия. Вопрос, каковы реальные последствия? У меня никогда не хватало смелости щелкнуть по этой ссылке, чтобы увидеть, что она делает. Что они могут делать эффективно и законно?

[обратный результат DNS]: вы были идентифицированы как робот, действующий с нарушением правил, опубликованных на arxiv.org.

Если это определение ошибочно, сообщите об этом по адресу www-admin@arxiv.org, чтобы можно было исследовать вашу проблему.

Scanning, Initialized:

10 minutes to Trinity...
9 minutes to Trinity...
8 minutes to Trinity...
7 minutes to Trinity...
6 minutes to Trinity...
5 minutes to Trinity...
4 minutes to Trinity...
3 minutes to Trinity...
2 minutes to Trinity...
1 minute to Trinity...

Нулевой уровень. Хорошего дня.

Связаться с нами

Итак ... это страница, на которую потрачено 10 минут очень время наивного бота. Вероятно, бесполезен для борьбы с вредоносными ботами, но может сэкономить некоторую пропускную способность при столкновении с плохо написанным парсером сайтов.

Никаких последствий, кроме как немного покрутиться. Большинство браузеров (и, возможно, их сервер) через некоторое время просто отключаются. Вероятно, они просто причиняют себе больше вреда, чем боты.