Можно ли использовать Icinga в качестве инструмента управления аварийными сигналами?
В документации очень четко прописаны два типа мониторинга:
Я думаю, что ищу третий тип мониторинга: есть ли какие-либо встроенные функции, которые обрабатывали бы асинхронные программные тревоги, которые не обязательно нарушают работу службы, но должны регистрироваться / управляться?
Например, скажем, ключевой процесс на ядрах сервера, но сам перезапускается. Служба работает, но я хотел бы видеть, что произошло основное событие (желательно с некоторой степенью серьезности).
Любая встроенная функция, которая сделает это за меня? Любые плагины, которые добавили бы эту функциональность?
Журнал мониторинга и предупреждений об указанных вами событиях. Для этого есть масса вариантов.
Один из таких вариантов - пассивные проверки в сочетании с ловушками snmp. Сценарий анализирует журнал вашего приложения и отправляет прерывание, которое затем отображается в nagios.