Я хочу контролировать некоторые серверы, и некоторые из них могут иметь очень нестабильное соединение.
Это потому, что они расположены в офисах, у которых есть доступ к Интернету только для потребителей.
Меня беспокоит обычный подход - проверка http или чего-то еще каждую минуту или другой интервал - это короткие перебои, которые могут не замечаться, потому что они происходят между проверками, но, скорее всего, могут вызвать нехватку конфиденциальных сервисных соединений или полностью их прервать .
На самом деле мы испытываем такие проблемы в одном месте, я уже часами кричал в кабельную компанию по телефону.
В настоящее время мы оцениваем возможность получить прямую связь с носителем на уровне (3), что было бы довольно круто и значительно облегчило бы мою жизнь.
Но для этого мне нужны надежные цифры, а не расплывчатые отчеты об опыте.
Так что мне бы хотелось иметь монитор времени безотказной работы, который открывает соединение с сокетом, держит его открытым и запрашивает ответ через довольно короткий интервал (20 секунд маби).
Если нет ответа, соединение должно быть прервано с момента последней проверки.
Я бы также использовал этот подход для «лучшего» мониторинга серверов в будущем.
Итак, мои вопросы:
Я думаю, вам стоит подойти к мониторингу с точки зрения потери пакетов и задержки. Вы можете использовать некоторые инструменты для постоянного пинга каждую секунду и другой инструмент, например Nagios, для отправки электронной почты о проблемах дольше установленного периода. Объедините это с хорошо продуманными внешними точками мониторинга, чтобы получить более широкую картину того, что и когда дает сбой, и вы должны получить некоторые хорошие показатели, чтобы бороться с вашим углом.
Почему бы не отслеживать все конфиденциальные службы, а не просто пинговать? Проверьте sql, http, ldap (или что-то еще). Большинство современных инструментов мониторинга могут выполнять глубокую служебную проверку. Тогда вы можете меньше заботиться о соединении, просто о том, что приложения работают нормально.