Один из моих сайтов получал запросы от googlebot в следующем порядке:
example-log:66.249.79.216 - - [06/Apr/2016:15:36:56 -0700] "GET /vvytnoxvontwusz.html HTTP/1.1" 404 15136 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" TLSv1.2 AES128-GCM-SHA256
Я получил несколько таких за последние пару дней. Адрес кажется подлинным в IP-пространстве Google, но я понятия не имею, что происходит, кроме того, что он правильно 404: я не был удивлен, обнаружив, что указанная страница отсутствует ни на моем сайте, ни в другом месте в Интернете. (как и следовало ожидать, если кто-то генерирует случайную строку из 15 символов).
Полагаю, я не слишком беспокоюсь об этом в целом, но есть ли у кого-нибудь ключ к пониманию того, что происходит? Спасибо!
Мне кажется, что это попытка подтверждения права собственности на веб-сайт Google, например, в Инструментах для веб-мастеров / Search Console:
https://support.google.com/webmasters/answer/35179?hl=en
Возможно, кто-то случайно добавил ваше доменное имя в свою учетную запись, теперь Google пытается это проверить. Никакого вреда я не вижу.
РЕДАКТИРОВАТЬ: Вы правы, имена файлов проверки часто начинаются с google-etchtml, поэтому вместо этого Google может проверять, что вы не обслуживаете страницы как спам, когда запрашиваются неправильные URL-адреса.
Видеть:
http://www.smythies.com/~doug/googlebot1.html
http://ubuntuforums.org/showthread.php?t=1724948&p=10659180#post10659180