Назад | Перейти на главную страницу

Службы уведомления о простоях системы

Мы отправляем нашим клиентам уведомления, когда планируем обслуживание системы, а также если система не работает или работает медленно. Мы используем несколько способов связи (электронная почта, сообщение о статусе веб-сайта, твиттер, записи в блогах, телефоны). Проблема с этим подходом заключается в том, что эти службы либо размещаются у нас, либо для работы требуется наше интернет-соединение.

На прошлой неделе у нас произошел серьезный провал. У меня нет всех подробностей, но в скорлупе T1 вышел из строя, и отказоустойчивый отказ. Электронная почта, телефоны, интернет, ftp не работали.

Я программист, и я предложил мне создать служебную программу, которая автоматизирует большинство этих задач уведомления с помощью простого веб-интерфейса. Это бесполезно, если мы разместим его внутри, а мы не будем работать. Нам нужно куда-то перенести службы уведомлений за пределы площадки.

Я опасаюсь, что если системные уведомления начнут приходить из другого домена, люди будут чесать в затылках; некоторые могут даже игнорировать предупреждения.

Какие-либо предложения?

Можете ли вы разместить свое программное обеспечение для уведомлений на другом хосте в другом месте / при другом подключении к Интернету, но разрешить ли оно поддомен вашего текущего домена? Например, если вы в настоящее время отслеживаете на example.com, вы можете переместить свою службу на monitor.example.com и начать отправлять уведомления оттуда.

Что касается утилиты, вы можете посмотреть Nagios - это достаточно полный набор инструментов для мониторинга, который может следить за веб-сервисами, FTP, электронной почтой и другими работами. Вы можете разместить его отдельно и просто настроить все свои основные службы для отправки статуса на хост Nagios, а затем настроить Nagios для отправки предупреждений, если он не слышит от основного сайта в течение определенного периода времени или если основной сайт начинает действовать неожиданно .