Я сделал:
apt-get install nagios nagios-plugins nagios-nrpe-plugin nagiosgrapher
и настроил nagios cfg на:
process_performance_data=1
service_perfdata_command=ngraph-process-service-perfdata-pipe
У меня есть один сервер с Ubuntu 11.04 (Desktop Edition) и один с 10.04 (Server Edition).
Дело в том, что сервер 10.04 распознал почти все плагины для построения графиков (пинг, нагрузка, пользователи, время ответа http, ...)
Сервер 11.04 распознал только время ответа http. Однако меня особенно интересует мониторинг нагрузки.
Флаг для регистрации данных о производительности есть в каждой службе, а также в моем шаблоне универсальной службы, так что это не проблема.
Вдобавок я сам написал множество специальных плагинов для мониторинга наших серверов. Они возвращают правильный код состояния и некоторый информационный текст.
Документация о нагиографе кажется очень редкой.
Теперь у меня следующие вопросы:
Как мне настроить новый плагин для правильной работы с nagios grapher? Где / как определить свойства регулярного выражения и ведения журнала / отображения?
Как мне поддерживать, какие службы отображаются на графике, помимо флага в определении службы nagios? - Надо ли как-то перенастроить / обновить нагиографа? Как узнать, почему услуга не изображена на графике, а должна быть?
редактировать:
Я уже выяснил, что в /etc/nagiosgrapher/ngraph.d есть 3 папки. Два из них содержат служебные файлы:
Ubuntu 11.04 для настольных ПК
joe@flimmit-joe:/etc/nagiosgrapher/ngraph.d$ find .
.
./extra
./extra/check_snmp.ncfg
./extra/check_bacula.ncfg
./extra/check_spamassassin_effectiveness.ncfg
./extra/check_gsm.ncfg
./extra/check_request_tracker.ncfg
./extra/check_windows.ncfg
./extra/check_hardware.ncfg
./extra/check_weather.ncfg
./nmgraph.ncfg
./templates
./standard
./standard/check_imap.ncfg
./standard/check_nagios.ncfg
./standard/check_ntp.ncfg
./standard/check_mailq.ncfg
./standard/check_ftp.ncfg
./standard/check_dns.ncfg
./standard/check_mysql.ncfg
./standard/check_pop.ncfg
./standard/check_smtp.ncfg
./standard/check_http.ncfg
./standard/check_ldap.ncfg
другой сервер
Сервер Ubuntu 10.04
root@ct39140:/etc/nagiosgrapher/ngraph.d# find .
.
./extra
./extra/check_hardware.ncfg
./extra/check_gsm.ncfg
./extra/check_request_tracker.ncfg
./extra/check_weather.ncfg
./extra/check_spamassassin_effectiveness.ncfg
./extra/check_snmp.ncfg
./extra/check_bacula.ncfg
./extra/check_windows.ncfg
./nmgraph.ncfg
./templates
./standard
./standard/check_ping.ncfg
./standard/check_users.ncfg
./standard/check_mysql.ncfg
./standard/check_ldap.ncfg
./standard/check_smtp.ncfg
./standard/check_http.ncfg
./standard/check_imap.ncfg
./standard/check_procs.ncfg
./standard/check_ftp.ncfg
./standard/check_pop.ncfg
./standard/check_mailq.ncfg
./standard/check_load.ncfg
./standard/check_nagios.ncfg
./standard/check_ntp.ncfg
./standard/check_dns.ncfg
./standard/check_swap.ncfg
./standard/check_disk.ncfg
Теперь я вижу, что сервер 10.04 действительно содержит больше плагинов (почему я не знаю), которые являются именно теми сервисами, которые другой не отображает!
Эврика!
Поэтому я скопировал файлы плагинов, убедился, что они доступны, и перезапустил nagios, но службы по-прежнему не отслеживаются.
Любые идеи?
naigiosgrapher рекурсивно сканирует свою папку conf.d на предмет соответствия файлов ncfg плагинам.
нет необходимости в дальнейшей активации помимо флага регистрации данных о производительности в определении службы.
Хитрость заключалась в том, что мне пришлось перезапускать nagiosgrapher и nagios3 несколько раз, чередуя с некоторой задержкой.