Назад | Перейти на главную страницу

Управлять журналами в большом количестве разнородных систем?

В команде, с которой я работаю, есть проблема с управлением журналами, мы управляем более чем сотней машин с разнородными системами, с несколькими сотнями приложений.

Гетерогенные системы с разной платформой: windows, linux, documentum, kofax, websphere, iis и т. Д. Все с разными форматами журналов и местоположением журналов, некоторые в средстве просмотра событий, а большинство в отдельных файлах журналов и т.д.

Иногда сложно понять, на каких машинах установлена ​​каждая система, иногда на машинах заканчивается свободное пространство, иногда нет простого способа найти, где расположены журналы.

В идеале журналы должны быть доступны очень быстро, чтобы мы могли совместно устранять неполадки, немедленно сокращая время простоя из-за аномалий. И мы должны хранить их какое-то время, чтобы неявные проблемы выявлялись «апостериори». И необходимо обеспечить свободное дисковое пространство, система в производственной среде никогда не должна останавливаться.

Вы знаете решение и / или продукт, которые могут помочь в подобной ситуации?

Если вы можете сделать данные, которые хотите регистрировать, доступными через SNMP, инструмент мониторинга, например Зенос Ядро или Нагиос / кактусы позволяет извлекать эти данные SNMP из каждой системы, регистрировать и графически отображать их, а также генерировать предупреждения при превышении пороговых значений. SNMP хорош тем, что он доступен бесплатно и кроссплатформенно. Zenoss Core также бесплатен и прост в настройке. Мы используем его для мониторинга только полдюжины серверов, но он масштабируется до многих сотен. Для некоторых функций требуется платная корпоративная версия.

Инструмент вроде Splunk это еще один вариант. Он просто собирает необработанные данные журнала (вы указываете своим серверам отправлять свои журналы на ваш сервер Splunk), индексирует их и делает доступными для поиска. Вы можете создавать отчеты, информационные панели и предупреждения. Он требует дополнительных настроек и не является бесплатным, но он эффективен, потому что он очень свободен и позволяет сопоставлять события на многих серверах. Посмотрите их демонстрационное видео.

Я почти уверен, что Nagios - это то, что вам нужно. Он настроен в нашей сети, и он отлично работает.

Мы используем монтирования NFS от NetApp 2020 в качестве центральных точек регистрации - вам еще нужно написать код для поиска проблем, но, по крайней мере, все они находятся в меньшем количестве мест.