В течение последних нескольких дней у меня было много запросов к несуществующим страницам на моем сервере.
Беспокоит то, что, когда я смотрю журнал ошибок 404, который я создал для своего сайта, эти запросы, похоже, маскируют имя моего сервера: когда я запрашиваю CGI.SERVER_NAME
(это эквивалент ColdFusion для PHP $_SERVER['SERVER_NAME']
), он возвращает не имя моего сервера, как ожидалось, а другие внешние доменные имена (некоторые из них взяты с "хитрых" веб-сайтов).
Взглянув на журнал доступа apache, все запросы следуют одному шаблону:
[root@myserver]# grep DAPPER-HOST-IP access_log | head -n 1
XXX.XX.XXX.XX - - [30/Sep/2013:02:11:28 +0100] "GET
/page-completely-unrelated-to-my-website.cfm HTTP/1.1" 404 1826 "-"
"Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1)DAPPER-HOST-IP:YY.YYY.YY.YYY"
где XXX.XX.XXX.XX
всегда являются IP-адресами определенной поисковой системы (которые я не особо люблю хранить). Пользовательский агент всегда имеет строку «DAPPER-HOST-IP» и YY.YYY.YY.YYY
это всегда разные случайные IP-адреса, не связанные ни с моим сервером, ни с вышеупомянутой поисковой системой. Я подозреваю, что этот IP-адрес имеет какое-то отношение к проблеме маскировки имени сервера.
Единственное, что я предпринял, - это заблокировать некоторые IP-адреса поисковой системы. Я надеюсь, что этого достаточно, хотя меня все еще беспокоит тот факт, что некоторые запросы, сгенерированные на моем сервере, выглядят как исходящие с других серверов.
Приветствуются любые другие предложения. Единственная полезная ссылка, которую я нашел в Интернете до сих пор: http://www.webmasterworld.com/search_engine_spiders/4612980.htm
Это тот же эффект, что и при указании любого случайного доменного имени (через DNS или файл hosts) на IP-адрес вашего сервера. Например, если я установил запись A для www.example.com, укажу ее на XXX.XX.XXX.XX и перейду на www.example.com, тогда «www.example.com» будет отображаться как хост в журнале ошибок.
Остается только догадываться, какова цель этого мошеннического или неправильно настроенного бота, но кроме добавления бесполезных строк в ваши журналы, похоже, что он не причиняет никакого реального вреда.
Я бы рекомендовал настроить ваш веб-сервер таким образом, чтобы он не обслуживал содержимое вашего виртуального хоста по умолчанию, когда домен указывает на ваш сервер, как я описывал ранее.
См., Например, https://stackoverflow.com/questions/5427379/apache-default-virtualhost.