Я создал кучу плагинов munin, которые отслеживают различные серверные службы. Если показатели опускаются ниже пороговых значений, установленных в munin.conf
, мы получаем уведомление по электронной почте. Однако, если одна из этих служб полностью выйдет из строя, плагин выйдет из строя, и никто не получит уведомление!
Я выполнил руководство по написанию модуля и добавил код выхода и сообщение:
sys.stderr.write('Error connecting to %s: %s\n' % (name, e))
sys.exit(2)
Но это только появляется в журнале. Журнал никто не смотрит.
Есть ли способ сделать так, чтобы Munin предупреждал о полном отказе плагина?
Вы открыты для альтернатив? Я считаю, что проверка журнала может решить вашу проблему.