Назад | Перейти на главную страницу

Эскалация Nagios, преждевременная критическая эскалация после предупреждения

В Nagios 3 я хотел бы, чтобы услуга была повышена после критических XX минут. Он отлично работает с сервисами от UP до CRITICAL. Однако, если служба выдает предупреждение> XX минут (например, для дискового пространства, которое медленно увеличивается) и становится критическим, самая первая ошибка вызывает эскалацию. Он подсчитывает предупреждения в счет эскалации, когда мы хотим, чтобы он не сработал после 3 КРИТИЧЕСКИХ сигналов тревоги, а не после 3 предупреждений и одного критического.

Есть ли решение, которое позволит мне игнорировать предупреждения о подсчете для эскалации проверки службы?

Вот пример другого пользователя с такой же проблемой - и очень похожими конфигурациями. http://copilotco.com/mail-archives/nagios-users.2009/msg00310.html)

Поскольку я не использую эскалацию в своих Nagios реализации я буду говорить вслепую, только о документация для определения эскалации услуг.

Возможно, вам придется рассмотреть first_notification директива:

first_notification: Эта директива представляет собой номер, который определяет первое уведомление, для которого действует эта эскалация. Например, если вы установите это значение на 3, эта эскалация будет использоваться только в том случае, если служба находится в состоянии, отличном от ОК, достаточно долго для выхода третьего уведомления.

А также рассмотрим escalation_options директива:

escalation_options: Эта директива используется для определения критериев, которые определяют, когда используется это расширение службы. Эскалация используется, только если служба находится в одном из состояний, указанных в этой директиве. Если эта директива не указана при эскалации обслуживания, эскалация считается действительной во всех состояниях обслуживания. Допустимые параметры представляют собой комбинацию одного или нескольких из следующих: r = повышение в состоянии ОК (восстановление), w = повышение в состоянии ПРЕДУПРЕЖДЕНИЕ, u = повышение в состоянии НЕИЗВЕСТНО и c = повышение в состоянии КРИТИЧЕСКОЕ. Пример: Если вы укажете w в этом поле, эскалация будет использоваться только в том случае, если служба находится в состоянии ПРЕДУПРЕЖДЕНИЕ.

Итак, чтобы достичь того, чего вы хотите (эскалация после 3 КРИТИЧЕСКИХ сигналов тревоги), я бы попробовал такое определение:

define serviceescalation{
    host_name              myhost
    service_description    Disk Usage
    first_notification     3
    last_notification      0
    notification_interval  10
    contact_groups         admins
    escalation_options     c,r
    }

Надеюсь, это поможет ... и сработает ...!