Назад | Перейти на главную страницу

Странное поведение Google при индексировании несоответствия SSL-контента

Вот вам странный. У нас есть сервер с несколькими VHOSTS, которые включают в себя домены как SSL, так и без SSL.

В Domain1 включен SSL, а в Domain2 - нет.

Поскольку все эти домены размещены на одном IP-адресе, apache будет отвечать на запросы httpS на domain2, загружая первый виртуальный хост с поддержкой SSL, поэтому в основном, если вы перейдете на httpS: // domain2, браузер предупредит вас о несоответствии SSL, для чего потребуется пользователь должен щелкнуть расширенные настройки перед просмотром содержимого Domain1 (первый домен SSL Apache)

1) Если Chrome достаточно умен, чтобы понять, что существует несоответствие SSL, почему, черт возьми, Google все еще индексирует контент домена 1 в https://domain2.com

2) С тех пор мы исправили проблему, переписав ошибку 404 для всех страниц httpS // domain2.com. Мы также использовали инструменты Google для веб-мастеров, чтобы удалить все записи httpS // domain2.com, однако, они возвращаются каждые 4-6 недель! Я дошел до того, что использовал инструмент Google fetch URL, чтобы убедиться, что httpS // domain2.com приводит к 404 с их точки зрения, и это действительно так.

Как, черт возьми, Google все еще находит контент домена 1 в httpS // Domain2.com? Полагаются ли они на кеши даже после запроса на удаление?

Все, что я могу думать, это то, что у Google есть контент, кэшированный локально, и они продолжают использовать этот контент для повторного создания индексов; Это означает, что после того, как мы вручную запрашиваем удаление контента, они не сканируют сайт для воссоздания этого индекса, а полагаются на свою собственную локальную кэшированную копию.