Я использую webalizer-2.23-04-cygwin, последний двоичный файл, который мне удалось найти, и он делает то же самое, что и более старая версия, с определенным файлом журнала размером 900 МБ, который у меня есть. Он показывает только первые 411 обращений, все до 18:00, не то чтобы в этом ничего особенного, по крайней мере, когда я сам смотрю на строки файла журнала, я не вижу большой разницы.
Я использую файл sample.conf только со следующими изменениями:
Последнее связано с тем, что я получал несколько сообщений об усеченном имени пользователя, но в моем файле журнала даже нет имен пользователей, первых 411 строк или нет.
Пример строки 407:
10.0.1.1 - - [24/Sep/2010:17:42:27 -0400] "GET /home/ HTTP/1.1" 200 13382 "http://intapp/task5394" "Mozilla/5.0 (Windows; U; Windows NT 5.2; en-US; rv:1.9.2.10) Gecko/20100914 Firefox/3.6.10"
Пример строки 435:
10.0.1.1 [24/Sep/2010:18:20:17 -0400] "GET /home/ HTTP/1.1" 200 11644 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.2; en-US; rv:1.9.2.10) Gecko/20100914 Firefox/3.6.10"
Пример подавленного предупреждения:
Skipping bad record (3639)
Warning: Truncating oversized username
Что я здесь делаю не так?
Формат файла журнала отличается в двух ваших примерах. Поскольку webalizer ожидает первый формат, он не может проанализировать второй формат.
Во втором примере поля 2 и 3 (каждое из которых является -
здесь) были удалены.
У вас есть несколько вариантов: вы можете отредактировать файл журнала, чтобы заменить отсутствующие поля, или вы можете изменить конфигурацию webalizer, чтобы игнорировать отсутствующие поля. В любом случае вам почти наверняка придется разделить файл журнала при этом изменении, чтобы работать с ним.