Назад | Перейти на главную страницу

Nagios - не уверен, какой интервал следует изменить, чтобы ограничить количество отправлений уведомления при возникновении ошибки.

У меня есть сервер Nagios, который контролирует множество серверов. Время от времени мы сталкиваемся с ошибкой, которая не может быть решена на данный момент, и пока оставляем ее. Когда это происходит, мы продолжаем получать по электронной почте уведомления о сбое в работе службы. Так что, если мы не решим проблему на следующий день - мы получаем около 500 уведомлений по электронной почте об этом. Теперь мой вопрос: в чем разница между notification_interval и interval_length и какое значение я должен редактировать? Я хочу настроить его таким образом, чтобы при возникновении ошибки я получал только одно уведомление о проблеме вместо, например, 10 уведомлений в час. Я хочу, чтобы Nagios отправлял мне электронное письмо только один раз при возникновении ошибки и каждые 12 часов, пока ошибка не будет исправлена. Как этого добиться?

Вам, вероятно, следует оставить эти настройки в покое и использовать подтверждение функция в Nagios.

Это позволяет вам сообщить Nagios, что вы знаете о проблеме, и затем он будет подавлять отправку уведомлений до тех пор, пока статус не изменится (то есть станет хуже, или начнет мигать, или ошибка исчезнет, ​​и в этом случае предупреждения также прекратятся).

Видеть Acknowledge_Host_Problem для лучшего объяснения того, что это делает. Извините, я не могу найти более свежую страницу, чем эта, но она достаточно хорошо объясняет концепцию.

Чтобы напрямую ответить на ваш вопрос, хотя я думаю, что есть способ лучше:

  • interval_length это количество секунд - по умолчанию 60
  • notification_interval - желаемый интервал между уведомлениями. Если вы оставите только interval_length, это будет количество минут между уведомлениями.

Таким образом, чтобы получить 12 часов между уведомлениями, вы можете установить для параметра notification_interval значение 720 и оставить interval_length в одиночестве.

Но я все же думаю, что настройка подтверждения лучше, потому что она позволяет НагiOS сохранить ворчатьподбадривать свою команду, пока они не начнут действовать.

Обратите внимание, что в любом случае Nagios может отправлять уведомления чаще, в зависимости от того, что происходит. У меня были предупреждения об использовании ЦП, где оно колебалось между чуть выше и чуть ниже критического порога - независимо от того, что я делал, каждый раз, когда оно превышало критическое пороговое значение, выходило предупреждение. В обнаружение взмахов в Nagios используется для обработки этих ситуаций. Или вы можете посмотреть на свои пороговые значения предупреждений.

в чем разница между notification_interval и interval_length

  • interval_length: количество секунд на «единичный интервал», значение по умолчанию 60
  • notification_interval: количество «единиц времени» для ожидания перед повторным уведомлением

Я хочу настроить его таким образом, чтобы при возникновении ошибки я получал только одно уведомление о проблеме вместо, например, 10 уведомлений в час.

Устанавливать notification_interval на 0, Nagios не будет повторно уведомлять контакты о проблемах для этой службы / хоста.

Я хочу, чтобы Nagios отправлял мне электронное письмо только один раз при возникновении ошибки и каждые 12 часов, пока ошибка не будет исправлена.

Если вы не изменили interval_length, просто установите notification_interval до ... 720.