Назад | Перейти на главную страницу

Настройте .htaccess, чтобы заблокировать индексирование ботов, но разрешить просмотр / просмотр каталогов браузера

Я знаю, чтобы показать список каталогов моих файлов в браузере через .htaccess я могу использовать

Options +Indexes

и чтобы запретить Google и большинству ботов сканировать мой каталог, я могу использовать

Options -Indexes

Можно ли по-прежнему разрешить отображение видимого списка каталогов через браузер, но предотвратить сканирование / индексирование ботами только с помощью .htaccess?

Ваш .htaccess файл не может волшебным образом отличить «настоящих» пользователей от «ботов». Поскольку с точки зрения веб-сервера различий нет.

Однако, как правило, боты уважают содержимое robots.txt, а веб-браузеры - нет.

В качестве альтернативы, если у вас есть способ определить, что является ботом, а что нет, вы можете включить это правило в свою .htaccess конфигурация. Распространенной тактикой является применение набора RewriteRules, которые фильтруют на основе сообщенных User-Agent заголовок. Например, пользовательский агент, содержащий слово "googlebot", наверное под управлением Google.

User-Agents.org имеет список популярных идентификаторов пользовательских агентов. Но помните, что содержимое этого заголовка задается человеком, который запускает бот / браузер, и может содержать все, что он захочет. Так, например, злоумышленники обычно копируют строку User-Agent из популярного браузера или, возможно, популярной поисковой системы. Так что на это нельзя полагаться.