Это должно быть просто, так что, скорее всего, мой подход полностью отклонен, и кто-то, надеюсь, подтолкнет меня в правильном направлении.
У нас есть экземпляр сервера Zabbix 2.0.3, настроенный для мониторинга множества различных серверов, но теперь нам нужно настроить его для мониторинга и уведомления любых предупреждений в отношении отказоустойчивого кластера Active-Passive SQL Server 2008 R2.
По сути, это кластер из двух серверов, когда только один из его узлов может быть «активным» в данный момент времени, обслуживая все запросы, связанные с SQL Server, в то время как другой сервер просто «спит» и с точки зрения любого, кто вошел в систему. сервер - все службы, связанные с SQL Server, остановлены.
Мы попытались настроить Zabbix агентов на обоих серверах, используя шаблоны SQL Server 2005 (мы не смогли найти каких-либо специфических для 2008 года, а те, которые были в 2005 году, всегда работали нормально для мониторинга экземпляров 2008 R2) и настроили Zabbix сервер для обоих серверов, но в конечном итоге мы получаем постоянные предупреждения о том, что сервер в настоящее время является пассивным в кластере. Нам удалось найти различные методы фактического мониторинга аварийного переключения, но мы не смогли найти никаких указаний относительно того, как указать Zabbix, что в этом конкретном случае ожидается, что только один из серверов в группе будет быть в онлайн-состоянии, в то время как другой может быть просто отброшен и не должен вызывать никаких предупреждений.
Надеюсь, я ясно выразился. Спасибо за любые указания. У меня нет идей.
Я ничего не знаю о кластере SQL Server, но, вероятно, существует IP-адрес службы, связанный с активным узлом, который выполняет переключение на другой узел в случае события высокой доступности. Вместо того, чтобы контролировать SQL Server на обоих ваших узлах (хосты в zabbix), создайте новый хост «SQL Server Active» с IP-адресом службы и отслеживайте SQL Server только на этом хосте.
У меня есть 3 хоста в zabbix для мониторинга кластеров. 1 и 2, конечно же, УЗЛЫ. 3-й - кластер. Я слежу за ними, проверяя в кластере, какое у него имя хоста в настоящее время, поэтому он вводит имя хоста активного узла. Я также нашел способ проверить статус через WMI. Просто спросите гугл :)