Поэтому мы запускаем Groundworks (с Nagios) на CentOS для мониторинга наших различных серверов и процессов. У меня есть настройка для автоматической отправки электронных писем и текстов SMS, когда что-то достигает состояния ПРЕДУПРЕЖДЕНИЕ или КРИТИЧЕСКОЕ. Обычно это работает отлично. Однако дважды у нас были проблемы с Postfix на том сервере, где Postfix решает прекратить отправку электронной почты. Последний раз длился 4 дня, потому что никто из нас не заметил.
Это подводит меня к важному вопросу: как я должен контролировать свой сервер мониторинга?
Конечно, со вторым сервером мониторинга. Второй может быть намного проще, поскольку все, что от него требуется, - это отслеживать первый. И это, конечно же, должно в свою очередь контролироваться основной системой мониторинга.
Если ваша группа является частью более крупной организации с отдельной ИТ-инфраструктурой, вы можете организовать наблюдение за вашей службой другой группы.
Вы также можете убедиться, что сервер отправляет сообщение «все в порядке» каждый день, и выработать привычку его искать. (Это, конечно, эффективно только в том случае, если вы еще не перегружены рутинными сообщениями.)
Очевидно, ваш постфикс тоже нужно отслеживать, но это уже другая тема;)
я использую Плагин Nagios Checker для Firefox, он всегда отображается в строке состояния на любом компьютере, который я регулярно использую.
Вдобавок у меня есть собственный сценарий на внешнем хосте, который пингует хост nagios и отправляет SMS, если он не отвечает на пинги.
Пока (5+ лет) все работало нормально (стук по дереву).
Для мониторинга сервера (в нашем случае - nagios) отлично подходит бесплатный или базовый план Pingdom или alertfox.
Если ваш сервер мониторинга доступен из Интернета, он должен контролироваться внешним провайдером (например, websitepulse и др.).
Первое: позвольте ему отправлять сообщения «Я жив» один или два раза в день. Во-вторых, я запускаю старую машину только для этой цели, у которой есть другой GSM-модем, небольшой ИБП и т. Д. И выделенное (прямое) соединение с первичным сервером мониторинга. Это также помогает с третьим пунктом: регулярно проверяйте состояние своих систем мониторинга. Небольшая вспомогательная система мониторинга все время отображает страницу состояния основной системы в моем офисе.