У меня есть сервер etch nagios (я назову его NagiosServer), который успешно отслеживает множество вещей, включая другой сервер etch (MonitorEtch). Используя check_nrpe и check_procs, я могу проверить список процессов на наличие запущенных демонов, таких как '/ usr / sbin / squid'.
Проверьте MonitorEtch от NagiosServer (правильные результаты):
/usr/lib/nagios/plugins/check_nrpe -H MonitorEtch -c check_process -a /usr/sbin/squid 1:1 1:1
PROCS OK: 1 process with args '/usr/sbin/squid'
/usr/lib/nagios/plugins/check_nrpe -H MonitorEtch -c check_process -a whatever 1:1 1:1
PROCS CRITICAL: 0 processes with args 'whatever'
Я построил новый сервер, за которым хочу следить, на котором запущен Lucid (MonitorLucid). Независимо от того, какой процесс я пытаюсь контролировать с помощью NagiosServer, я получаю дополнительный результат, чем должен.
Проверьте MonitorLucid от NagiosServer (неверные результаты):
/usr/lib/nagios/plugins/check_nrpe -H MonitorLucid -c check_process -a whatever 1:1 1:1
PROCS OK: 1 process with args 'whatever'
ps ax|grep sophie
12737 ? Ss 0:00 /usr/sbin/sophie -D
12738 ? S 0:03 /usr/sbin/sophie -D
19591 pts/0 S+ 0:00 grep --color=auto sophie
/usr/lib/nagios/plugins/check_nrpe -H 192.168.19.252 -c check_process -a sophie 1:1 1:1
PROCS CRITICAL: 3 processes with args 'sophie'
Содержимое /etc/nagios/nrpe_local.cfg в MonitorLucid / MonitorEtch:
allowed_hosts=NagiosServer,127.0.0.1
dont_blame_nrpe=1
command[check_process]=/usr/lib/nagios/plugins/check_procs -a $ARG1$ -m PROCS -w $ARG2$ -c $ARG3$
Но если я выполню проверку локально, она вернет правильные результаты!
Проверьте MonitorLucid от MonitorLucid (правильные результаты):
/usr/lib/nagios/plugins/check_procs -a whatever -m PROCS -w 1:1 -c 1:1
PROCS CRITICAL: 0 processes with args 'whatever'
/usr/lib/nagios/plugins/check_procs -a sophie -m PROCS -w 1:1 -c 1:1
PROCS CRITICAL: 2 processes with args 'sophie'
На данный момент у меня нет идей, если не считать проверки на 1 экземпляр больше, чем следовало бы.
У меня была похожая проблема. check_procs
внутренне звонит /bin/ps axwo 'stat uid pid ppid vsz rss pcpu comm args'
, он перечисляет процессы, а затем считает их. Если вы настроили nagios для работы с другим пользователем, он использует sudo
для выполнения команды. И вот в чем проблема. Если вы напечатаете sudo ps -AF | grep sudo
, некоторая отдача от распределения "grep sudo
", другие возвращаются"sudo ps -AF
" и "grep sudo
". Поскольку check_procs считает все процессы, вы получите разные результаты на разных машинах. К сожалению, у меня пока нет решения, как заставить check_procs не подсчитывать sudo
процессы.
Похоже на версию check_procs
в Lucid глючит (или, по крайней мере, его поведение изменилось); тот факт, что он всегда находит одну лишнюю, предполагает, что он выполняет сопоставление подстроки для любой части имени процесса и аргументов и находит один из процессов, связанных с запуском плагина. Стоит сообщить об ошибке в Ubuntu.