Назад | Перейти на главную страницу

Может ли Nagios отправлять предупреждения о критической ситуации, происходящей в течение длительного периода времени?

Есть ли в nagios какой-либо плагин или средство, которое может это сделать? например: загрузка процессора до 80% за 2 секунды не будет проблемой. Я хочу получить оповещение, если оно останется на уровне 80% ++ в течение как минимум 5 минут. Является ли это возможным??

Пока с сервисом все в порядке, Nagios проверяет его каждые check_interval минут (ну технически interval_length, но обычно это одна минута). Если проверка службы не удалась, Nagios будет проверять службу каждые retry_interval минут и будет отправлять предупреждение только в том случае, если служба остается в состоянии сбоя в течение max_check_attempts чеки. Видеть документация для подробностей обо всем этом.

Имея это в виду, вы можете сделать retry_interval большой или набор max_check_attempts large или и то, и другое, чтобы увеличить время, в течение которого служба должна находиться в состоянии сбоя, прежде чем сообщать об ошибке.

Поэтому, если вы хотите получать оповещение только после сбоя службы более пяти минут, вы можете установить retry_interval к 1 и max_check_attempts до 5. Обратите внимание, что по умолчанию (я думаю) retry_interval = 1 и max_check_attempts = 3.

вы всегда можете составить собственный сценарий проверки. например, вы можете иметь сар запущенная в cron и ваша кастомная проверка nagios контролируют последние 30 минут сэмплов из sar.