Назад | Перейти на главную страницу

Мониторинг производственного сервера

У нас есть 3 выделенных сервера, разделенных на несколько VPS с использованием openVZ. Мы используем munin для мониторинга VPS с производственными сайтами и мониторинга на одном из VPS, чтобы убедиться, что он перезапускает службу в случае сбоя.

Дело в том, что нам нужен гораздо лучший способ мониторинга всех наших серверов, так как у нас есть до 14 VPS, мы хотели бы иметь центральный хаб, где мы могли бы видеть не только данные, собранные munin, но также некоторые дополнительные статистические данные. о сетях и производительности наших услуг.

Некоторые из наших требований:
- SMS-уведомление о сбое (возможность настройки определенной пользовательской проверки)
- Анализатор логов для apache error_log и некоторых других.
- Должен быть центральным (имеется в виду один сервер и несколько узлов, собирающих данные).
- Не требует простоты установки, но прост в обслуживании.
- Нужно быть свободным

Меня указали на nagios и splunk, как вы думаете? Спасибо,

У меня аналогичная установка, только с Xen на месте. Мне очень понравилось сочетание:

  • Nagios для предупреждений (с использованием PNP для упрощенного построения графиков и Nagviz для панели мониторинга состояния службы)
  • Ганглии для исторического построения графиков систем
  • OSSEC как HIDS и, что не менее важно, как сборщик для централизованного ведения журнала
    • примечание: существует плагин Splunk для OSSEC, который объединяет эти два инструмента. очень ну, я жду, когда они перенесут его на Splunk v4.
  • Splunk Наконец, как только несколько плагинов Splunk будут перенесены, мы планируем использовать Splunk с некоторой предварительной фильтрацией журналов (чтобы не превысить ограничение бесплатных выпусков).

Я надеюсь, что совместное использование наших настроек мониторинга поможет вам :-)

Вот несколько полезных ссылок:

http://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-1/index.html

https://www.ibm.com/developerworks/linux/library/l-ganglia-nagios-2/

http://www.ossec.net/main/splunk-ossec-integration

Обновить:

Я забыл упомянуть, что мы также используем макет конфигурации Matt Simmons Nagios, найденный здесь http://www.standalone-sysadmin.com/blog/2009/07/nagios-config/

Этот макет сделал нашу конфигурацию Nagios разумной и намного более простой в обслуживании (спасибо, Мэтт!)

У меня был большой успех с Zabbix, он удовлетворяет все ваши баллы в одном пакете.


(источник: zabbix.com)

Самым сложным будет получение мониторинга журнала apache, но Zabbix является расширяемым, поэтому вы можете использовать LogWatch или какой-либо другой скрипт Perl для сбора данных за вас.

Мне нравится OpManager, и он бесплатен до определенного количества узлов. Выполняет все вышеперечисленное, довольно прост в установке и обслуживании.

Nagios должен быть хорошим выбором. Прежде всего - он модульный и удовлетворяет практически все ваши ожидания. Кроме того, он получил несколько приятных награды.

РЕДАКТИРОВАТЬ: не забудьте проверить этот ответ.