Назад | Перейти на главную страницу

Как удалить / деиндексировать страницу из Google?

На странице результатов, когда я набрал "e-luminate", третья и четвертая ссылки, кажется, указывают на конкретный каталог глубоко внутри папок, в которых хранятся изображения. Как мне избавиться от этих двух результатов из результатов поиска Google? Как я могу заставить Google деиндексировать его?

Я проверил на сервере, и папки, похоже, не отличаются от других папок, но эти 2 пути, похоже, индексируются Google.

Спасибо.

Сначала подпишитесь на Инструменты Google для веб-мастеров учетная запись. Это позволит вам просматривать статистику Google о том, как они сканируют ваш сайт, и позволяет запрашивать удаление страниц из индекса (подробнее об этом позже).

Затем настройте robots.txt файл для вашего сайта. Вам не нужно блокировать весь свой сайт от Google, чтобы использовать robots.txt. Все поисковые системы следят за robots.txt, поэтому это также помешает сайтам, таким как Bing или Yahoo, индексировать эти страницы.

Чтобы настроить это, создайте robots.txt в виде простого текстового файла в корневом каталоге вашего сайта (например, http://www.example.com/robots.txt). Синтаксис очень прост: вы указываете пользовательский агент, к которому он должен применяться, используя * как подстановочный знак для всех роботов, и вы указываете, куда роботы не должны сканировать. Обратите внимание, что вы не должны включать какие-либо страницы, которые вы хотите быть полностью «секретными», так как это общедоступный файл. Синтаксис для robots.txt как следует:

User-agent: user agent name
Disallow: directory name
Disallow: another directory
Disallow: (etc)

Если вы хотите запретить поисковым системам индексировать данные в подкаталоге вашего каталога изображений, вы можете сделать что-то вроде этого:

User-agent: *
Disallow: /images/foo/bar/
Disallow: /images/foo/baz/

Вы даже можете запретить только определенный файл:

User-agent: *
Disallow: /images/foo/bar/qux.jpg

Настройка robots.txt предотвратит индексирование указанных каталогов и файлов в будущем. Со временем эти страницы будут удалены из поискового индекса, но не сразу. Чтобы ускорить этот процесс, используйте свою учетную запись Инструментов для веб-мастеров, чтобы отправить запрос на удаление URL-адреса из индекса. Щелкните учетную запись веб-сайта, URL-адрес которой вы хотите удалить, затем откройте «Конфигурация сайта» слева. Нажмите «Доступ для сканера», затем откройте вкладку «Удалить URL». Нажмите «Новый запрос на удаление» и введите URL-адрес, который нужно удалить. Затем нажмите Enter. Страница должна попросить вас подтвердить, что вы уже заблокировали URL-адрес через robots.txt (что вы только что сделали). Нажмите ОК, и он должен отправить запрос. Обычно на обработку запроса уходит 1–3 дня. Вы можете проверить статус запроса, войдя в свою учетную запись инструментов для веб-мастеров в любое время.

Вы сначала пробовали искать?

Я искал "Удалить страницу из индекса Google" и получил эту страницу: Удалить страницу или сайт из результатов поиска Google.

Он говорит, что вы должны создать robots.txt файл.

После этого вы можете перейти к Инструменты Google для веб-мастеров чтобы запросить скорейшее удаление.

Прочтите о файлах robots.txt, и вы поймете, что вы просто помещаете файл robot.txt в любую папку, которую хотите полностью удалить из Google, и через несколько часов или дней он больше не будет отображаться. Файл robots.txt создается с помощью инструментов для веб-мастеров в вашей учетной записи Google. Попробуйте!