Мы запускаем систему, предназначенную для интеграции с Microsoft SQL Server в кластерной установке. В настоящее время у нас есть оба узла базы данных, отслеживаемые под Nagios, и все в порядке, кроме проверки узла базы данных:
check_tcp -H $ АДРЕС ХОСТА $ -p 1433
Наверное, таким образом нельзя напрямую отслеживать отказоустойчивый кластер. Как мне вместо этого контролировать доступность базы данных кластера?
Когда дело доходит до SQL Server в кластере, он должен быть установлен как виртуальный узел, будь то экземпляр по умолчанию или именованный экземпляр. Таким образом, проверка TCP, где имя хоста является виртуальным именем с правильным портом, должна работать. Например, если у меня есть двухузловой кластер с физическими узлами:
Не отслеживайте ни один из них для SQL Server. Когда SQL Server установлен, скажем, я выбрал имя виртуального узла Virtual1, тогда вы захотите отслеживать Virtual1. А если SQL Server работает, значит, кластер работает. Если вы просто хотите проверить, работает ли кластер, найдите сетевое имя самой группы кластера.
Почему бы не подключиться к тому же ip / имени хоста с помощью mssql-plugin, что и ваше приложение? Для завершения мониторинга я бы добавил хост для виртуального IP-адреса и два хоста для каждого узла кластера. Поэтому, если один из ваших узлов выходит из строя, вы получаете уведомление, но вы знаете, что кластер все еще в порядке, потому что вы не получили уведомления.