Есть ли хорошее программное обеспечение для мониторинга работоспособности набора связанного программного обеспечения?
Требования следующие:
В качестве примера предположим, что у нас есть ежедневный экспорт, который запланирован на 6 утра каждое утро. После завершения экспорта он отправлял сообщение о состоянии POST, говоря, что он завершен, передавая какой-то ключ приложения для идентификации экспорта. Если это сообщение о статусе не пришло, скажем, к 6:30 утра, может быть отправлено электронное письмо, это приложение должно стать красным на панели инструментов и т. Д.
Приложения также должны иметь возможность публиковать сообщения об ошибках / предупреждения.
По сути, цель состоит в том, чтобы иметь возможность отслеживать все наши внутренние проекты из одной системы, а не множество писем, файлов журналов и т. Д.
Я подозреваю, что мне, вероятно, придется писать это с нуля, но я просто подумал, что спрошу.
Nagios - это все, что вы хотите. Немного сложно правильно настроить, но работает отлично. Не пишите для этого свое собственное программное обеспечение, Nagios уже делает это и делает это очень хорошо.
Что касается публикации сообщений на Nagios, вы можете использовать NSCA для удаленного доступа или простые сценарии для локального.
Попробуйте использовать Failsafe. Он отслеживает эхо-запросы сервера и html-запросы веб-сервера. Затем он отправляет предупреждение и может запускать сценарий. https://sites.google.com/site/bigsoftwarecreations/home/failsafe
OpenNMS тоже крутая :) Как писал @Sacx: NagiOS немного сложен в настройке.