Назад | Перейти на главную страницу

Мониторинг нарушений SLA на основе событий? (например, задержки файлов)

Наш текущий SLA требует доставки файла в течение определенного временного окна. У нас довольно мало таких файлов, созданных в разное время в течение дня.

Я знаю сайты внешнего мониторинга, такие как Site24x7, которые будут отслеживать сбои в работе определенных служб. Например, если наш FTP-сервер выйдет из строя, мы получим уведомление.

Но существует ли какая-либо служба хоста ИЛИ серверное программное обеспечение, которое может отслеживать наши процессы и генерировать уведомления, когда (а) ожидаемое событие задерживается больше, чем назначенное время, и (б) когда ожидаемое событие, наконец, происходит?

Я ищу уведомление вроде «Файл XYZZY.DAT должен был быть опубликован 91 минуту назад, но его все еще нет».

Это может сделать любой обычный инструмент мониторинга. Смотрите Zabbix, Zenoss, Icinga ... или даже дурацкие самодельные скрипты. Для Zabbix кажется, что вы можете использовать trapper, чтобы сообщить zabbix о событии из вашего скрипта, доставляющего файлы, затем вы можете объединить это с простыми проверками, чтобы увидеть, доступен ли ваш сервер, на котором размещены эти файлы, удаленно. Все упомянутые приложения имеют панель управления, но также могут отправлять оповещения на почту, телефоны, страницы и т. Д.