Назад | Перейти на главную страницу

Предлагает ли Nagios панель «ведения журнала событий», если нет, что мне следует использовать для отслеживания событий?

Я использую Nagios, чтобы следить за тем, чтобы определенное количество серверов и процессов оставалось в сети. Это хорошо работает, и я доволен этим.

Однако я хотел бы иметь объединенный «журнал событий» на серверах, которые я унаследовал и которые сейчас администрирую. События в основном представляют собой задания cron, хотя было бы неплохо регистрировать события и другими способами. Вот как сейчас настроено большинство заданий cron:

###
@hourly /backup/myscript.sh | mail -s "Myscript started" serverlog@mydomain.com

Как лучше собрать журналы с разных серверов в одном месте? Возможно, я даже смогу войти в Nagios, щелкнуть вкладку «Журнал событий» и увидеть все эти уведомления.

Это не замена фактическим файлам журнала, созданным сценарием (хранящимся на сервере), а просто еще один способ следить за происходящим и быстро оглядываться назад, если что-то не работает правильно.

Я открыт для предложений по этому поводу и хотел бы услышать, как вы это делаете, или лучшие практики.

ps: Я также должен упомянуть, что причина, по которой я хотел бы это изменить, заключается в том, что в день генерируются сотни электронных писем, что затрудняет определение реальной проблемы. Думаю, мне также нужна возможность регистрировать вещи как «завершенные» или «обнаруженные ошибки» или что-то в этом роде, а затем получать уведомления по электронной почте при возникновении проблемы. Может, я слишком на многое надеюсь.

Поскольку вы можете использовать Nagios, написав свои собственные плагины, определенно есть способы сделать это.

Например, я использую Splunk для сбора журналов событий для всех моих серверов, сетевых устройств и т. Д. То же самое можно сделать с общим сервером системного журнала или сбросом в базу данных.

У меня настроен поиск в Splunk, который Nagios выполняет и выполняет логику оповещения. Я бы посоветовал, если вы хотите пойти по этому пути, получите хорошее представление о том, как писать собственные плагины. Как только вы это сделаете, определите, что именно вы хотите добавить на свою панель управления Nagios.

У nagios действительно есть панель мониторинга. Реальная сила nagios заключается в том, что вы можете написать свои собственные триггеры, чтобы информировать вас по электронной почте / txt-message / phone-call / blinky-lights / всем, что вы можете написать ... о любых проблемах / предупреждениях / ошибках. Существует также веб-интерфейс, который показывает вам все, что вы отслеживаете, в различных конфигурациях ... (например, сервисные группы ... серверы ... отдельные мониторы ... и т. Д.)

Если вы намерены следить за происходящим без необходимости входить в систему отдельно на каждом сервере, вы можете собрать все журналы в одном месте, используя сервер системного журнала. Таким образом, вам нужно просто искать всю сопутствующую информацию в одном месте.

Я бы порекомендовал вам взглянуть на LogZilla. Он позволяет вам регистрировать все централизованно, выполнять поиск по ним и даже создавать графики / диаграммы и т. Д. Мы используем его около года, и мне он очень нравится. Также есть бесплатная лицензия для небольших магазинов.

edit: есть "живая" демонстрация, работающая на http://demo.logzilla.pro