Назад | Перейти на главную страницу

Сравните журналы ошибок для всего парка услуг, найдите уникальные ошибки

Я ищу инструмент, в котором я могу перечислить серверы для проверки, расположение файла, и он вернет список наиболее распространенных ошибок на этих серверах (например, 2 или 3 сервера для краткости отчета) и получит отчет что-то вроде этого

Server.A     Server.B     Server.C
--------     --------     --------
42 error.X   39 error.X   61 error.X
21 error.Y   7  error.Y   5  error.A
17 error.B   6  error.A   4  error.Y
4  error.A   2  error.R   3  error.S
3  error.R   1  error.S   1  error.R

Конечно, исключая временные метки и другие сведения об ошибках и просто выделяя общие подстроки и перечисляя их вот так. Я мог бы посмотреть на таблицу и увидеть, что ошибка B уникальна для Server.A, и сделать вывод, что с Server.A что-то не так. Что-то подобное уже существует? Это что-то, что мне придется написать самому?

Я не обязательно ищу этот конкретный отчет, просто функцию поиска уникальных ошибок в наборе журналов ошибок.

Похоже, тебе нужно корреляция событий. См., Например, бесплатный Простой коррелятор событий.

Splunk и logstash может также предоставить вам необходимый анализ журнала и корреляцию. Splunk бесплатен только для очень ограниченного использования, а logstash имеет открытый исходный код.

Независимо от того, по какому пути вы идете, вам следует изучить централизованное ведение журнала и сбор всех ваших журналов на выделенном сервере журналов, чтобы облегчить такой анализ без предварительного подключения к удаленным системам.