У меня есть сервер Nagios, который контролирует множество серверов. Время от времени мы сталкиваемся с ошибкой, которая не может быть решена на данный момент, и пока оставляем ее. Когда это происходит, мы продолжаем получать по электронной почте уведомления о сбое в работе службы. Так что, если мы не решим проблему на следующий день - мы получаем около 500 уведомлений по электронной почте об этом. Теперь мой вопрос: в чем разница между notification_interval и interval_length и какое значение я должен редактировать? Я хочу настроить его таким образом, чтобы при возникновении ошибки я получал только одно уведомление о проблеме вместо, например, 10 уведомлений в час. Я хочу, чтобы Nagios отправлял мне электронное письмо только один раз при возникновении ошибки и каждые 12 часов, пока ошибка не будет исправлена. Как этого добиться?
Вам, вероятно, следует оставить эти настройки в покое и использовать подтверждение функция в Nagios.
Это позволяет вам сообщить Nagios, что вы знаете о проблеме, и затем он будет подавлять отправку уведомлений до тех пор, пока статус не изменится (то есть станет хуже, или начнет мигать, или ошибка исчезнет, и в этом случае предупреждения также прекратятся).
Видеть Acknowledge_Host_Problem для лучшего объяснения того, что это делает. Извините, я не могу найти более свежую страницу, чем эта, но она достаточно хорошо объясняет концепцию.
Чтобы напрямую ответить на ваш вопрос, хотя я думаю, что есть способ лучше:
Таким образом, чтобы получить 12 часов между уведомлениями, вы можете установить для параметра notification_interval значение 720 и оставить interval_length в одиночестве.
Но я все же думаю, что настройка подтверждения лучше, потому что она позволяет НагiOS сохранить ворчатьподбадривать свою команду, пока они не начнут действовать.
Обратите внимание, что в любом случае Nagios может отправлять уведомления чаще, в зависимости от того, что происходит. У меня были предупреждения об использовании ЦП, где оно колебалось между чуть выше и чуть ниже критического порога - независимо от того, что я делал, каждый раз, когда оно превышало критическое пороговое значение, выходило предупреждение. В обнаружение взмахов в Nagios используется для обработки этих ситуаций. Или вы можете посмотреть на свои пороговые значения предупреждений.
в чем разница между notification_interval и interval_length
interval_length
: количество секунд на «единичный интервал», значение по умолчанию 60notification_interval
: количество «единиц времени» для ожидания перед повторным уведомлениемЯ хочу настроить его таким образом, чтобы при возникновении ошибки я получал только одно уведомление о проблеме вместо, например, 10 уведомлений в час.
Устанавливать notification_interval
на 0, Nagios не будет повторно уведомлять контакты о проблемах для этой службы / хоста.
Я хочу, чтобы Nagios отправлял мне электронное письмо только один раз при возникновении ошибки и каждые 12 часов, пока ошибка не будет исправлена.
Если вы не изменили interval_length
, просто установите notification_interval
до ... 720.