Мне интересно, есть ли способ защитить веб-сервер, на котором размещен платный контент, запретив пользователю загружать весь контент на его жесткий диск; таких как обнаружение нетипичного поведения (например, сохранение каждой страницы, быстрая обработка всего содержимого) и возможность автоматически реагировать на это.
Я сделал несколько поисков, например для «обнаружения выбросов», «анализа поведения» или «обнаружения вторжений» и обнаружил Фырканье, но это скорее кажется желательной частью брандмауэра, чем веб-сервера. Я ожидал, что решение будет больше похоже на прокси-сервер, модуль Apache или расширение Typo3. Возможно, я провел неудачные поиски из-за отсутствия точного английского выражения для такого компонента.
Есть ли способ защититься от такого поведения?
На самом деле, нет. Главным образом потому, что когда веб-браузер открывает веб-страницу для ее просмотра, отправляемые им запросы идентичны запросам, которые парсер ссылок будет использовать для загрузки всего сайта.
Допустим, у вас есть платный сайт, содержащий тысячи фотографий, за которые вы взимаете ежемесячную абонентскую плату, и вы добавляете новый контент еженедельно. У вас есть сотня галерей, каждая из которых содержит 20-30 фотографий. Вы заплатили хорошие деньги за эти фотографии и работающие на них модели, поэтому вы хотите защитить свою собственность.
Когда веб-браузер загружает каждую галерею, он будет делать 20-30 одновременных запросов для каждой фотографии на странице. После того, как запрос сделан, у вас нет контроля над тем, что с ним произойдет после того, как он покинет ваш сервер.
Вы можете попробовать такие вещи, как:
Убедитесь, что от вашего защищенного контента может обрабатываться не более 3 запросов в секунду. Но это просто раздражает ваших законных пользователей, которые просто пытаются загрузить свой po ^ H ^ Hcontent. И все, что он делает для ваших скребков, - это замедляет их на несколько секунд.
Это часто используется для блокировки хотлинкинга - убедитесь, что каждый запрашиваемый ресурс имеет действительный HTTP-реферер, соответствующий вашим доменам из белого списка. Но любое приличное программное обеспечение для выщелачивания все равно отправит действительного реферера, а подделать его невероятно тривиально, поэтому вы зря тратите здесь свою энергию.
Это остановит только самый простой способ загрузки контента - щелчок правой кнопкой мыши и выбор «Сохранить объект как ...», и его невероятно просто обойти.
И, в конце концов, вашим пользователям просто нужно нажать кнопку Print Screen, чтобы вообще сделать копию всего, что отображается на их экране.
Вы не можете этого предотвратить.