Я ищу инструмент, в котором я могу перечислить серверы для проверки, расположение файла, и он вернет список наиболее распространенных ошибок на этих серверах (например, 2 или 3 сервера для краткости отчета) и получит отчет что-то вроде этого
Server.A Server.B Server.C
-------- -------- --------
42 error.X 39 error.X 61 error.X
21 error.Y 7 error.Y 5 error.A
17 error.B 6 error.A 4 error.Y
4 error.A 2 error.R 3 error.S
3 error.R 1 error.S 1 error.R
Конечно, исключая временные метки и другие сведения об ошибках и просто выделяя общие подстроки и перечисляя их вот так. Я мог бы посмотреть на таблицу и увидеть, что ошибка B уникальна для Server.A, и сделать вывод, что с Server.A что-то не так. Что-то подобное уже существует? Это что-то, что мне придется написать самому?
Я не обязательно ищу этот конкретный отчет, просто функцию поиска уникальных ошибок в наборе журналов ошибок.
Похоже, тебе нужно корреляция событий. См., Например, бесплатный Простой коррелятор событий.
Splunk и logstash может также предоставить вам необходимый анализ журнала и корреляцию. Splunk бесплатен только для очень ограниченного использования, а logstash имеет открытый исходный код.
Независимо от того, по какому пути вы идете, вам следует изучить централизованное ведение журнала и сбор всех ваших журналов на выделенном сервере журналов, чтобы облегчить такой анализ без предварительного подключения к удаленным системам.