Есть ли в nagios какой-либо плагин или средство, которое может это сделать? например: загрузка процессора до 80% за 2 секунды не будет проблемой. Я хочу получить оповещение, если оно останется на уровне 80% ++ в течение как минимум 5 минут. Является ли это возможным??
Пока с сервисом все в порядке, Nagios проверяет его каждые check_interval
минут (ну технически interval_length
, но обычно это одна минута). Если проверка службы не удалась, Nagios будет проверять службу каждые retry_interval
минут и будет отправлять предупреждение только в том случае, если служба остается в состоянии сбоя в течение max_check_attempts
чеки. Видеть документация для подробностей обо всем этом.
Имея это в виду, вы можете сделать retry_interval
большой или набор max_check_attempts
large или и то, и другое, чтобы увеличить время, в течение которого служба должна находиться в состоянии сбоя, прежде чем сообщать об ошибке.
Поэтому, если вы хотите получать оповещение только после сбоя службы более пяти минут, вы можете установить retry_interval
к 1 и max_check_attempts
до 5. Обратите внимание, что по умолчанию (я думаю) retry_interval
= 1 и max_check_attempts
= 3.
вы всегда можете составить собственный сценарий проверки. например, вы можете иметь сар запущенная в cron и ваша кастомная проверка nagios контролируют последние 30 минут сэмплов из sar.