мы стараемся отслеживать возраст файлов на некоторых из наших рабочих станций. Прекрасно работает с NSClient ++, но мы не хотим получать КРИТИЧЕСКИЕ сообщения при выключении компьютера.
Для хоста у нас есть фиктивная проверка, возвращающая ОК при каждой проверке. Но когда рабочая станция отключена, проверка возраста файла не выполняется с сообщением «В соединении отказано».
Есть ли у вас какие-нибудь подсказки, чтобы избежать этих КРИТИКОВ?
Если служба связана с хостом (именем), если тест check-host-alive (или что-то еще, что вы настроили) завершился неудачно, предупреждения службы не будут отправлены. Не забудьте добавить погрешность в max_checks, чтобы учесть ситуацию, когда компьютер выключается, но все еще отвечает на эхо-запросы (или что-то еще, что вы используете для check-host-alive).
В качестве альтернативы, если ваша программа проверки возраста файлов выдает только ПРЕДУПРЕЖДЕНИЯ, а не КРИТИЧЕСКИЕ, где ПРЕДУПРЕЖДЕНИЯ - это ошибки, связанные с возрастом файла вне границ, а КРИТИЧЕСКИЕ - это ошибки недоступности хоста, просто замаскируйте КРИТИЧЕСКИЕ ошибки:
service_notification_options w,u,r
Тем не менее, что вам действительно следует сделать, если это ваша цель, - это переписать плагин, чтобы он возвращал UNKNOWN для этого обстоятельства, и в этом случае это будет:
service_notification_options c,w,r
Выключаются ли рабочие станции в предсказуемое время? то есть они будут только с 9 до 17 или что-то подобное? Если да, вы можете определить период времени в Nagios и применить его к рабочим станциям; тогда они будут проверены только в течение этого периода времени.
Вы пробовали использовать опцию -u в check_nrpe?