Пытаюсь прямо здесь изложить мои факты.
Является Sensu (довольно новый ребенок в блоке), предназначенный для замены обоих следующих ?:
Подведем итог, что делает каждая из этих программ:
Nagios собирает данные с помощью некоторой комбинации локального выполнения программ, выполнения программ в удаленных системах (через ssh или nrpe) и получения данных от независимых программ (через nsca). Данные, которые собирает nagios, обычно представляют собой просто значения 0, 1, 2 или 3 для состояний ok, предупреждение, критическое и неизвестное (хотя некоторые плагины поддерживают отправку показателей производительности). Nagios обрабатывает данные, отправляя предупреждения. Существует приличное количество возможностей настройки для получения предупреждений об определенных элементах в определенное время, подтверждения предупреждений, их эскалации и т. Д.
Collectd собирает метрики системы и приложений с помощью плагинов, которые сами считывают данные (например, статус apache, использование процессора) или получают данные от других процессов (например, клиентов statsd, других экземпляров collectd). При желании Collectd может агрегировать или фильтровать данные. Затем он может записать его на диск (в виде файлов csv или rrd) или отправить его по сети через ряд протоколов (collectd, graphite, http, mongo, redis, riemann, amqp). У него есть возможность отправлять оповещения, но это довольно просто.
Сервер Sensu собирает данные с помощью некоторой комбинации, сообщая клиентам sensu выполнять команды, настроенные на сервере (проверка), или получать данные от команд, настроенных на клиенте (автономная проверка). Данные могут быть состоянием, например, nagios использует или метрикой. Sensu может изменять полученные данные с помощью мутаторов. Затем он передает данные обработчикам, которые могут делать такие вещи, как отправлять предупреждения или отправлять данные куда-нибудь (например, графит). Sensu имеет богатый API для настройки на лету.
Nagios и sensu - сопоставимое программное обеспечение, но collectd - нет. Вы можете представить себе использование collectd для передачи данных nagios через ncsa или передачи данных sensu через amqp, хотя для выполнения любого из этих действий потребуется написать новые плагины для collectd.
Я подозреваю, что можно использовать Sensu как замену Nagios (он поддерживает проверки и действия).
Что касается замены collectD, пожалуй. Трудно сказать, не спросив того, кто действительно работает над этим.
Моей первой мыслью было: «Хм, только релиз 0.9, интересно, действительно ли он готов к производственному использованию».