Ищете параметр конфигурации, чтобы проверки, которые отвечают ОК, не переходят в жесткое состояние, пока не будет достигнуто max_check_attempts.
Проблема в том, что у нас будет услуга, которую мы можем подключить к сети, а затем она вернется к работе через пару минут, но когда она вернется, она отправит уведомление OK, которое закрывает проблему в нашей системе продажи билетов.
Я бы порекомендовал сначала определить, сколько времени после отключения проектора является приемлемым периодом времени, прежде чем рассматривать отключение как новое отключение, а не как часть последнего отключения.
В зависимости от того, насколько похоже это окно, я бы посоветовал последовать предложению @ b0fh и переделать чек. Если окно короткое (несколько минут), просто передайте проверке результат ОК, чтобы она заснула на Х минут, а затем повторно запустите проверку; если он проходит во второй раз, отправьте код выхода 0. Однако, если окно длиннее нескольких минут, я бы сказал, что лучшим вариантом является переработка проверки по существу с кешированием состояния (чтобы вы могли сравнить отключение / устройство до против кеша). Чтобы этот метод был более эффективным, вам может потребоваться запустить сценарий / проверку как запланированное задание на хосте Nagios и заставить его отправлять результаты пассивной проверки в Nagios.
Nagios считает хост или службу, которые действуют описанным вами образом, хлопанье. Вы можете настроить обнаружение лоскута для этого хоста / службы.
Используйте команду check_command, чтобы переопределить проверку хоста по умолчанию и определить настраиваемую проверку / сценарий, который будет выполнять желаемое количество проверок перед объявлением состояния. Еще проще, снова используя команду check_command, определить новый check-host-alive, который имеет несколько эхо-запросов перед объявлением хоста неработающим. По умолчанию - один пинг.