Назад | Перейти на главную страницу

Обязательные инструменты для управления произвольными демонами * nix и их действиями

Какие инструменты вы посоветуете для управления запущенными демонами? Это включает:

  1. Мониторинг нагрузки: ренис демона, когда он замедляет работу всего сервера
  2. Сохранение живого: перезапустите его, когда он не работает. Может, подключение проверяет?
  3. Есть ли какие-нибудь расширенные инструменты для обработки / ротации / анализа журналов?
  4. Удобные уведомления об ошибках: электронная почта, icq, jabber, ...
  5. Мониторинг в реальном времени: munin || нагиос, конечно! :) Может быть, есть еще что-нибудь, что можно использовать?
  6. ... другие предложения?

Мониторинг нагрузки: обновить демон, когда он замедляет работу всего сервера. Сохранение активности: перезапустить его, когда он не работает. Может, подключение проверяет?

Nagios может выполнять обе эти задачи с помощью обработчики событийдля renice я бы предпочел, чтобы это выполнялось самостоятельно, потому что проверки через что-то вроде ssh могут отключаться, если сервер находится под нагрузкой. В идеале у демона есть собственные средства управления, чтобы этого не происходило, то есть «Максимальное количество подключений».

Any advanced log processing/rotation/parsing tools?

Мне нравится logrotate для ротации логов, это довольно стандартно. Что касается обработки, мне нравится Splunk, если вы можете себе это позволить или не нуждаетесь в функциях, которые предлагает платная версия.

Handy error notifications: e-mail, icq, jabber, ... 

Чтобы добавить в свой список, многим людям нравятся текстовые (SMS) сообщения.

Проверьте также Cfengine. У нас он работает во всем, от Linux до AIX и Windows. Это открытый исходный код, но есть коммерческая версия, которая может сделать некоторые дополнительные трюки для реального облегченного мониторинга.

Splunk - это нормально, но если вы немного научитесь магии регулярных выражений, вы мало что сможете сделать.