Допустим, у нас есть группа из 100 хостов, каждый из которых отслеживается для службы X. Допустим, эта служба отключается на всех хостах. Вместо того, чтобы получать 100 отдельных предупреждений, я хотел бы получать одно предупреждение о том, что «Служба X не работает для всей группы хостов» или что-то в этом роде. Возможно ли это с Nagios? Как это реализовать? Я смотрю в Интернете, но не вижу, чтобы обсуждалась эта конкретная ситуация.
РЕДАКТИРОВАТЬ: обратите внимание, что это не сетевой сервис, это локальная проверка, выполняемая на каждом хосте. В частности, это проверка того, истек ли срок действия локального сертификата SSL.
Я нашел то, что по большей части удовлетворяет то, что я искал. Это плагин nagios под названием check_multi который объединяет набор проверок службы и / или хоста вместе и создает единое уведомление на основе определенных вами гибких критериев (логики).
Почему бы не написать свою собственную команду / сценарий, который проверяет каждый сертификат сервера, объединяет данные, а затем предупреждает, если процент проверок терпит неудачу?
Вы можете проверить срок действия сертификата с помощью openssl из командной строки:
echo | openssl s_client -connect google.com:443 2>/dev/null | openssl x509 -noout -dates
Прокрутите свои серверы в Bash, а затем установите статус выхода на основе аргументов Bash, которые вы передаете сценарию, а затем настройте его как команду Nagios.
Прелесть Nagios в том, что вы можете создавать свои собственные мониторы для любых целей.