Назад | Перейти на главную страницу

Масштабируемый мониторинг оповещений по электронной почте

Кто-нибудь знает способ масштабируемого мониторинга предупреждений по электронной почте?

Многие из моих служб на месте отправляют мне электронные письма об успехе (или неудаче) критических задач. Причина, по которой я получаю электронное письмо об успешном выполнении, заключается в том, что иногда сбой по своей природе не может быть отправлен сервисом по электронной почте.

К сожалению, это не масштабируется, теперь я получаю так много предупреждений, что на самом деле не отслеживаю их, но я не могу позволить себе предупреждать о сбое, потому что в прошлом это было слишком ненадежно.

В идеале я бы хотел облачную службу (или почтовый ящик), что-то похожее на Pingdom, чтобы я мог также отправлять / пересылать эти предупреждения, которые будут отправлять мне электронное письмо / sms, когда он получает предупреждение об ошибке или в нем отсутствуют предупреждения об успехе.

У кого-нибудь есть идеи?

Вы предлагаете эффективно реорганизовать свою систему мониторинга (путем подачи предупреждений текущей системы в другую систему мониторинга, которая достаточно умна, чтобы знать, что что-то не так, если ее постоянно не заверяют, что все в порядке).

Это почти наверняка не то, что вам нужно. Что вам нужно, так это сочетание мониторинга на месте и за его пределами, которое надежно отправлять вам предупреждения о сбое, когда что-то выходит из строя (обычно из внутренней системы или из внешней системы, если по какой-то причине внутренняя система вышла из строя).


Помните о следующей аксиоме систем мониторинга:

Нет веских причин предупреждать об успехе.

Оповещение об успехе - это наиболее частая любительская неправильная конфигурация системы мониторинга.
Система мониторинга должна только предупредить вас о вещах, которые требовать действий.

Успех по определению не является событием, требующим действий, поэтому не должно генерироваться никаких предупреждений.
Отсутствие успеха по определению является «неудачей», поэтому должно быть сгенерировано действенное предупреждение об ошибке.

Отправка статусных сообщений «все в порядке» в конечном итоге приучает людей игнорировать сообщения из системы мониторинга (потому что в большинстве случаев никаких действий не требуется). Вы хотите, чтобы оповещения мониторинга были шокирующими событиями, побуждающими людей к действию, а не рутинными неприятностями, которые удаляются из их почтовых ящиков из мышечной памяти.