Назад | Перейти на главную страницу

Есть ли регулярно обновляемые базы IP-адресов ботов?

Я ищу базу данных IP-адресов известных ботов, чтобы идентифицировать их в трафике веб-сайта.

У меня есть данные агента-пользователя, но, похоже, многие из них не позволяют агентам-пользователям идентифицировать себя. Как правило, это спам-боты.

Я знаю о проекте приманки, но не знаю, есть ли у него база данных, к которой я могу легко получить доступ.

Не то, что я знаю о.

Поскольку большинство спам-ботов и тому подобное, вероятно, работают на скомпрометированной домашней машине, любой такой список быстро устареет, так как некоторые хосты очищаются, а бот каким-то образом попадает на другие хосты, и в любом случае не будет слишком полезен - почти все, что вы могли сделать, это заблокировать веб-трафик с хостов в списке или добавить сообщение в сценарии ответов веб-сервера, чтобы проинформировать пользователя о том, что они могут быть заражены.

Предоставление сообщения пользователю - пустая трата времени. ИМО - многие проигнорируют его, многие, кто должен его увидеть, этого не сделают, поскольку у вас не будет их правильного адреса в базе данных (из-за того, что у них нет фиксированного адреса, доступ через прокси, который имеет более одного внешнего адреса, или их законный трафик, проходящий через прокси, который бот-трафик обходит, и те, которые вам удается правильно сообщить о проблеме, вероятно, будут ожидать ты чтобы знать, как это исправить для них ...

Вероятно, ваш лучший выбор: xbl.spamhaus.org. С сайта:

Черный список эксплойтов Spamhaus (XBL) - это база данных IP-адресов захваченных компьютеров, зараженных незаконными сторонними эксплойтами, включая открытые прокси (HTTP, socks, AnalogX, wingate и т. Д.), Червей / вирусов со встроенными механизмами спама, в реальном времени. и другие виды эксплойтов троянских коней

Несомненно, многие источники спама исходят от эксплуатируемых серверов, так что все сводится к вашему определению «бота». Многие спамеры арендуют серверы и рассылают с них только спам - они не будут использовать их на законных основаниях. Вы действительно можете использовать любой RBL для спама и, вероятно, получить хорошее представление о том, сколько веб-трафика исходит от взломанных служб.