На странице результатов, когда я набрал "e-luminate", третья и четвертая ссылки, кажется, указывают на конкретный каталог глубоко внутри папок, в которых хранятся изображения. Как мне избавиться от этих двух результатов из результатов поиска Google? Как я могу заставить Google деиндексировать его?
Я проверил на сервере, и папки, похоже, не отличаются от других папок, но эти 2 пути, похоже, индексируются Google.
Спасибо.
Сначала подпишитесь на Инструменты Google для веб-мастеров учетная запись. Это позволит вам просматривать статистику Google о том, как они сканируют ваш сайт, и позволяет запрашивать удаление страниц из индекса (подробнее об этом позже).
Затем настройте robots.txt
файл для вашего сайта. Вам не нужно блокировать весь свой сайт от Google, чтобы использовать robots.txt
. Все поисковые системы следят за robots.txt
, поэтому это также помешает сайтам, таким как Bing или Yahoo, индексировать эти страницы.
Чтобы настроить это, создайте robots.txt
в виде простого текстового файла в корневом каталоге вашего сайта (например, http://www.example.com/robots.txt
). Синтаксис очень прост: вы указываете пользовательский агент, к которому он должен применяться, используя *
как подстановочный знак для всех роботов, и вы указываете, куда роботы не должны сканировать. Обратите внимание, что вы не должны включать какие-либо страницы, которые вы хотите быть полностью «секретными», так как это общедоступный файл. Синтаксис для robots.txt
как следует:
User-agent: user agent name
Disallow: directory name
Disallow: another directory
Disallow: (etc)
Если вы хотите запретить поисковым системам индексировать данные в подкаталоге вашего каталога изображений, вы можете сделать что-то вроде этого:
User-agent: *
Disallow: /images/foo/bar/
Disallow: /images/foo/baz/
Вы даже можете запретить только определенный файл:
User-agent: *
Disallow: /images/foo/bar/qux.jpg
Настройка robots.txt
предотвратит индексирование указанных каталогов и файлов в будущем. Со временем эти страницы будут удалены из поискового индекса, но не сразу. Чтобы ускорить этот процесс, используйте свою учетную запись Инструментов для веб-мастеров, чтобы отправить запрос на удаление URL-адреса из индекса. Щелкните учетную запись веб-сайта, URL-адрес которой вы хотите удалить, затем откройте «Конфигурация сайта» слева. Нажмите «Доступ для сканера», затем откройте вкладку «Удалить URL». Нажмите «Новый запрос на удаление» и введите URL-адрес, который нужно удалить. Затем нажмите Enter. Страница должна попросить вас подтвердить, что вы уже заблокировали URL-адрес через robots.txt
(что вы только что сделали). Нажмите ОК, и он должен отправить запрос. Обычно на обработку запроса уходит 1–3 дня. Вы можете проверить статус запроса, войдя в свою учетную запись инструментов для веб-мастеров в любое время.
Вы сначала пробовали искать?
Я искал "Удалить страницу из индекса Google" и получил эту страницу: Удалить страницу или сайт из результатов поиска Google.
Он говорит, что вы должны создать robots.txt файл.
После этого вы можете перейти к Инструменты Google для веб-мастеров чтобы запросить скорейшее удаление.
Прочтите о файлах robots.txt, и вы поймете, что вы просто помещаете файл robot.txt в любую папку, которую хотите полностью удалить из Google, и через несколько часов или дней он больше не будет отображаться. Файл robots.txt создается с помощью инструментов для веб-мастеров в вашей учетной записи Google. Попробуйте!