Я являюсь частью команды системного администратора \ DevOps для приложения. В настоящее время у нас есть около 25-40 виртуальных машин, работающих как разные части приложения в микросервисах на платформе контейнера openshift, с использованием также Jenkins, Nexus3, некоторых реляционных баз данных и баз данных mongo.
Я изучаю мониторинг серверов и различных служб Linux на них. Сначала я узнал о monit и частично от его возможности мониторинга одного сервера с использованием веб-интерфейса, это было довольно быстро и просто в использовании.
И снова у меня не может быть такого количества разных графических интерфейсов, на которые можно было бы взглянуть, чтобы понять состояние сети. Совсем недавно я столкнулся с ядром Nagios и XI и в настоящее время в процессе развертывания агентов nrpe_3.2.1 (ядро Nagios) на разных узлах сети, но из-за проблем с зависимостями я склоняюсь к Nagios XI для простоты использования. и так будет "просто работать". Я специально хочу, чтобы мониторинг службы и обработчики событий в случае сбоя службы или изменения статуса продолжали работать, не требуя моего внимания. Если я смогу получить подтверждение существующего или порекомендовать что-то лучшее (а также, надеюсь, бесплатное и с открытым исходным кодом), я был бы очень признателен. Спасибо, Ноам.
Нет причин не использовать M / Monit для получения центрального статуса в этой среде. Стоимость абсурдно низкая, и она будет подключаться к тому, что вы уже установили.