У меня есть веб-сайт, который я взял на себя как веб-мастер. Он был в WordPress, был взломан и на него были внедрены тысячи страниц СПАМА. Эти страницы были проиндексированы Google и в конце концов получили сообщение "Этот сайт может быть взломан"против результатов поиска.
Я перенес сайт на другую CMS и убедился, что он чистый, добавил его в свои инструменты для веб-мастеров, и новые страницы были проиндексированы - проблема в том, что Google только что добавил новые страницы к старым страницам для спама. Сайт небольшой - не более 100 страниц, но в поиске site:example.org
Я получил "Около 368000 результатов".
Инструменты Google для веб-мастеров отправляют сообщение: Робот Googlebot обнаружил значительное увеличение количества URL-адресов на http://example.org/ которые возвращают ошибку 404 (не найдено). Это может быть признаком сбоя или неправильной конфигурации, что может негативно повлиять на работу пользователя. Это приведет к тому, что Google исключит эти URL-адреса из результатов поиска. Если эти URL-адреса вообще не существуют, никаких действий не требуется.
Прошло больше месяца, но Google Webmaster Tools все еще сообщает об этих тысячах ошибок 404.
Я пробовал искать на форумах, и пока мой единственный вариант - полностью удалить сайт из индекса Google, а затем добавить его заново. Я не хочу этого отключения, потому что мы во многом полагаемся на поисковый трафик, чтобы найти сайт.
Есть идеи, как удалить эти 404 ненайденные страницы из индекса Google - всего 368 000 из них.
Вы пытались отправить карту сайта в Google.
Попросите Google повторно сканировать ваши URL-адреса. Если вы недавно добавляли или вносили изменения на страницу своего сайта, вы можете попросить Google (повторно) проиндексировать ее с помощью инструмента «Просмотреть как Google».
Функция «Запросить индексирование» в Fetch as Google - удобный метод для простого запроса индексации для нескольких URL-адресов; если у вас есть большое количество URL-адресов для отправки, проще отправить карту сайта. вместо. Оба метода примерно одинаковы по времени отклика.
Из: https://support.google.com/webmasters/answer/6065812?hl=en
Если это не сработает, если эти URL-адреса имеют аналогичный путь, попробуйте добавить этот URL-адрес в robot.txt в правиле запрета.
User-agent: *
Disallow: /common_path_indexed/
Вы можете попробовать добавить 301
перенаправляет эти страницы так, чтобы они указывали на вашу первую страницу. Это может ускорить удаление взломанных страниц Google.