Мы хотим сгенерировать список файлов, которые не попадали на наш веб-сервер в течение последних 3 месяцев, 6 месяцев и года.
IIS может предоставить нам список файлов, которые были поражены, но мне интересно, есть ли там инструмент, который будет генерировать список файлов в каталоге нашего веб-сервера, которые не отображаются в файлах журнала.
Боюсь, простого решения нет. Думаю, вам придется сравнить свои журналы со списком (я полагаю, статическим) файлов. Лучший способ, который я могу придумать, - это использовать LogParser инструмент.
Вы можете импортировать свои журналы в базу данных SQL и создать таблицу, содержащую все URL-адреса (выберите отдельные ...). Затем вам нужно будет создать список имен файлов в ваших каталогах с помощью сценария и импортировать полученный файл в другую таблицу базы данных. Шаг 3 - выбрать все имена файлов из таблицы 2, которые не имеют аналогов в первой таблице.
У Сплаттне есть ответ, который я собирался опубликовать. Я бы просто добавил к этому, что ДРУГОЙ способ действовать - это сделать следующее:
Переименуйте любой файл, который, как вы подозреваете, не используется, с префиксом «X_». Например, переименуйте suspect.htm в "x_suspect.htm"
Следите за своими 404 журналами, КАК ЯСТРЕБ. Мы использовали grep, чтобы проанализировать все ошибки 404 и найти «мертвые» файлы, которые на самом деле не были мертвыми. Верните их обратно (или поправьте ссылку), если нужно.
Это не мой ЛЮБИМЫЙ метод действий (например, показ покупателю 404), но он помогает подтвердить, используется ли файл или нет.
Надеюсь это поможет.
Сыщик Зену выполнит проверку потерянных файлов, если вы предоставите ему доступ по FTP к своему веб-сайту.
В целом это будет сложной задачей, поэтому я думаю, что вы вряд ли найдете готовое решение. Хотя вы можете получить список файлов, к которым осуществляется доступ, из журналов и сравнить его со списком файлов в соответствующих каталогах, вам необходимо учитывать любые файлы, к которым осуществляется доступ:
server.transfer
server.execute
#include
<script>
тегии так далее. Для некоторых приложений может быть много файл, который используется скриптами, но не отображается в журналах веб-сервера из-за способа ссылки на них.