Назад | Перейти на главную страницу

Журналы Apache переполнены соединениями - «(через ggpht.com GoogleImageProxy)»

Мой сервер работал на 100% ЦП, и просмотрев журналы Apache, я увидел сотни тысяч соединений, которые выглядели так:

10.190.45.31 - - [13/Mar/2014:15:29:02 +0000] "GET SOMETHING HTTP/1.1" 200 2261 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7 (via ggpht.com GoogleImageProxy)"

IP - это мой балансировщик нагрузки, который, к сожалению, я не настроил для ведения журнала, поэтому я не могу определить истинный источник этих запросов.

Кто-нибудь знает, что это за трафик?

Я тоже вижу такой трафик.

  • IP-адреса всегда находятся в 66.249.64.0/19 диапазон, который принадлежит Google.
  • Пользовательские агенты, которые я вижу, всегда такие же, как и у вас.
  • Запрашиваемые URL-адреса в основном представляют собой изображения, но иногда это не так.
  • Большинство URL-адресов изображений запрашиваются несколько раз. Два самых популярных изображения (которые, кстати, мы включаем только в электронные письма, отправляемые нашей платформой) составили 2/3 от общего числа запросов.

Я почти уверен, что это связано с недавнее изменение, которое они внесли в Gmail, чтобы автоматически загружать изображения в электронные письма но сделать это через прокси, чтобы получатель не мог быть идентифицирован.

Это сообщение в блоге поддерживает меня и включает тот же User-Agent.

Вероятно, вы могли бы проверить это, отправив себе электронное письмо в формате HTML на свой адрес Gmail, содержащее такой тег (заменив свой домен на example.com конечно):

<img src="http://example.com/this_probably_doesnt_exist.jpg">

Если вы видите такое же обращение от этого User-Agent для этого URL-адреса, то я прав в своем предположении.