Какие инструменты вы посоветуете для управления запущенными демонами? Это включает:
Мониторинг нагрузки: обновить демон, когда он замедляет работу всего сервера. Сохранение активности: перезапустить его, когда он не работает. Может, подключение проверяет?
Nagios может выполнять обе эти задачи с помощью обработчики событийдля renice я бы предпочел, чтобы это выполнялось самостоятельно, потому что проверки через что-то вроде ssh могут отключаться, если сервер находится под нагрузкой. В идеале у демона есть собственные средства управления, чтобы этого не происходило, то есть «Максимальное количество подключений».
Any advanced log processing/rotation/parsing tools?
Мне нравится logrotate для ротации логов, это довольно стандартно. Что касается обработки, мне нравится Splunk, если вы можете себе это позволить или не нуждаетесь в функциях, которые предлагает платная версия.
Handy error notifications: e-mail, icq, jabber, ...
Чтобы добавить в свой список, многим людям нравятся текстовые (SMS) сообщения.
Проверьте также Cfengine. У нас он работает во всем, от Linux до AIX и Windows. Это открытый исходный код, но есть коммерческая версия, которая может сделать некоторые дополнительные трюки для реального облегченного мониторинга.
Splunk - это нормально, но если вы немного научитесь магии регулярных выражений, вы мало что сможете сделать.