Меня это немного сбивает с толку - я настроил серверный процесс Nagios3 на одной машине (тала) и NPRE на двух других (Медея и ииянара.), и думал, что он настроен правильно. По разным причинам мне пришлось перестроить Медея из образа диска, и в результате NPRE больше не устанавливается.
Каково же мое удивление, когда Nagios (несколько дней спустя) продолжает радостно сообщать не только о том, что мой сервер работает, но и о ряде показателей производительности, таких как общие процессы и т. Д. Как оказалось, я почти уверен, что экземпляр Nagios действительно сообщал о localhost для обоих Медея и ииянара все это время.
Вот начальный блок + первый служебный блок из medea.conf:
define host{
use generic-host ; Name of host template to use
host_name medea.phyre.im
alias Medea
address 97.107.128.112
}
define service{
use generic-service ; Name of service template to use
host_name medea.phyre.im
service_description Disk Space
check_command check_all_disks!20%!10%
}
Любопытно, что если я укажу другой IP, Nagios сообщит, что машина не работает. Так что либо:
... И затем он ПРЕКРАТИТ выполнение этих действий, если я укажу, например, 197.107.128.112 в качестве целевого IP.
Мой вопрос в основном такой: какого черта?
check_all_disks
вероятно использует check_disk
плагин, который проверяет объем используемого пространства локально смонтированных файловых систем.
Вы должны использовать что-то вроде:
check_nrpe!check_all_disks
Проверьте http://www.kernelhardware.org/nagios-nrpe-to-monitor-remote-linux-server/
Короче говоря, для проверки диска и проверки процессора в /etc/nagios/objects/commands.cfg добавьте следующее
# for nrpe check_disk plugin
define command{
command_name check_disk
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
# for nrpe check_load plugin
define command{
command_name check_load
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
в /etc/nagios/objects/localhost.cfg, где server1
define service{
use local-service ; Name of service template to use
host_name server1
service_description Root Partition
check_command check_disk!check_disk
contact_groups admins
}
define service{
use local-service ; Name of service template to use
host_name server1
service_description Current Load
check_command check_load!check_load
contact_groups admins
}
проверьте, подходит ли конфигурация с
#nagios -v /etc/nagios/nagios.cfg
перезагрузить нагиос
#/etc/rc.d/rc.nagios reload