У меня есть несколько серверов, которые контролируются munin, и довольно часто один из выбранных устройств имеет временный сбой при чтении данных. В результате я получаю два электронных письма, в одном из которых сообщается, что все значения неизвестны, а во втором через пять минут сообщается, что в конце концов все в порядке.
Насколько я могу судить, munin работает так, как задумано здесь, но я хотел бы знать, есть ли способ отложить отправку начального «неизвестного» предупреждения для одного цикла обновления, чтобы не сообщалось о временных неизвестных? Все мои текущие настройки - это обучение меня игнорировать предупреждающие письма.
Если это не удается, есть ли способ вообще отключить отправку «неизвестных» предупреждений и соответствующих им предупреждений о восстановлении?
На самом деле я не использую Munin, но, как я вижу unknown_limit
Параметр может быть установлен для элементов / плагинов, который определяет, сколько последовательных неудачных чтений должно произойти перед установкой значения "неизвестно".
На основе модуля Munin :: LimitsOld по умолчанию установлено 3, я думаю, вам следует попробовать установить или увеличить это число.
Проверял на Munin 1.4.5.
Я достигаю этого за счет того, что munin уведомляет не напрямую конечных пользователей, а в NAGIOS через NSCA, а NAGIOS обрабатывает уведомления. Это означает, что я могу использовать (гораздо более сложные) элементы управления NAGIOS для задержки уведомления, частоты, эскалации и так далее. Да, NAGIOS достаточно тяжеловесен только для того, чтобы быть механизмом уведомлений, но вы также можете использовать его для качественного (а не количественного) мониторинга.
Помните, что одним из больших преимуществ использования инструментов с открытым исходным кодом является то, что вы можете посмотреть на исходный код, чтобы точно увидеть, что они делают (и изменить поведение, если оно вам не нравится). Быстрое сканирование LimitsOld.pm показывает, что предложение Габора является правильным - unknown_limit может быть установлен для каждой службы или глобально и появился около Munin 1.4.4 (см. http://munin-monitoring.org/ticket/828).