Я слежу за сервисом через check_nrpe до сотен ящиков. Всякий раз, когда эта служба выходит из строя, обычно все коробки выходят из строя и заполняются уведомлениями / текстовыми сообщениями.
Есть предложения о том, как и что использовать, чтобы свести все это в одну проверку?
Похоже, это хороший случай для использования системы зависимостей Nagios. Сделайте все сотни проверок зависимыми от этого check_nrpe, и это должно подавить все посторонние уведомления.
В дополнение к другим приведенным прекрасным предложениям, если вы действительно буквально хотите создать новую дополнительную проверку, которая срабатывает при срабатывании любой из наборов проверок, попробуйте check_service.pl http://exchange.nagios.org/directory/Plugins/Others/Check-many-services/details.
Если это так, сначала убедитесь, что вы следите за правильными вещами. Если, например, проблема в том, что коммутатор выходит из строя, и все, что вы делаете, это отслеживаете подключенные к нему хосты, вы получите кучу предупреждений об отключении хоста. Зависимости второго использования. Это позволяет nagios уведомлять вас об отказе коммутатора и игнорировать все предупреждения о сбоях хостов за ним.