robots.txt – список вопросов по тегу – страница №2

Привет, Обычно, если я набираю в адресной строке oneofmysites.com/robots.txt, любой браузер будет отображать содержимое файла robots.txt. Как видите, это довольно стандартное...

robots.txt redirect

Сайт сканирует анонимный бот, размещенный на Amazon ec2. Этот робот не уважает robots.txt и создает высокую нагрузку на веб-сервер, поэтому я добавил проверку, заканчивается ли...

Кто-нибудь может объяснить мне разницу между настройкой разрешить и запретить в файле robots.txt и создать метатеги No follow, No index! Можно ли запретить подписку и индекс в...

robots.txt

Я нахожусь в сложной ситуации, паук Baidu атакует мой сайт, вызывая пропускную способность около 3 Гб в день. В то же время я веду бизнес в Китае, поэтому не хочу просто его...

robots.txt bandwidth bandwidth-control web-crawler

Я запускаю ossec на своем сервере и периодически получаю такое предупреждение: Received From: myserver->/var/log/auth.log...

robots.txt ssh web-crawler googlebot

У нас есть сайт IIS, на котором работает Dotnetnuke, который мы переняли у другой группы. Мы добавили файл robots.txt в корень, но он возвращает 404. На самом деле любой...

robots.txt iis http-status-code-404

Один из моих сайтов получал запросы от googlebot в следующем порядке: example-log:66.249.79.216 - - [06/Apr/2016:15:36:56 -0700] "GET /vvytnoxvontwusz.html HTTP/1.1" 404 15136...

robots.txt apache-2.2 googlebot

Файл robots.txt Yahoo содержит: User-agent: * Disallow: /p/ Disallow: /r/ Disallow: /*? Что означает последняя строчка? ("Запретить: / *?")

robots.txt

Есть ли способ заблокировать автономные браузеры (например, Teleport Pro, Webzip и т. Д.), Которые отображаются в журналах как «Mozilla»? Пример: Webzip отображается в журналах...

robots.txt .htaccess

глядя на мой журнал доступа Apache, я вижу, что сканеры, как правило, получают старые версии страниц и документов, например: 119.63.196.86 - - [10/Jun/2011:10:36:31 +0200] "GET...

robots.txt apache-2.2 trac

robots.txt – список вопросов по тегу – страница №2

robots.txt перенаправляет на страницу по умолчанию

Забанить amazonaws.com - это хорошая идея

Robots.txt - нет подписки, нет индекса

Baidu Spider обеспечивает 3 Гб трафика в день, но я веду бизнес в Китае

Почему googlebot запрашивает robots.txt с моего SSH-сервера?

robots.txt и другие .txt, возвращающие 404 в IIS?

Что делать со случайными запросами, поступающими от робота Google, например vvytnoxvontwusz.html?

Значение запрета: / *? в robots.txt

Блокировать автономные браузеры

Используйте файл robots.txt, чтобы предотвратить получение сканерами старых версий страниц Trac