Назад | Перейти на главную страницу

Nagios NRPE check_procs сообщает неверный номер

У меня есть сервер etch nagios (я назову его NagiosServer), который успешно отслеживает множество вещей, включая другой сервер etch (MonitorEtch). Используя check_nrpe и check_procs, я могу проверить список процессов на наличие запущенных демонов, таких как '/ usr / sbin / squid'.

Проверьте MonitorEtch от NagiosServer (правильные результаты):

/usr/lib/nagios/plugins/check_nrpe -H MonitorEtch -c check_process -a /usr/sbin/squid 1:1 1:1
PROCS OK: 1 process with args '/usr/sbin/squid'

/usr/lib/nagios/plugins/check_nrpe -H MonitorEtch -c check_process -a whatever 1:1 1:1
PROCS CRITICAL: 0 processes with args 'whatever'

Я построил новый сервер, за которым хочу следить, на котором запущен Lucid (MonitorLucid). Независимо от того, какой процесс я пытаюсь контролировать с помощью NagiosServer, я получаю дополнительный результат, чем должен.

Проверьте MonitorLucid от NagiosServer (неверные результаты):

/usr/lib/nagios/plugins/check_nrpe -H MonitorLucid -c check_process -a whatever 1:1 1:1
PROCS OK: 1 process with args 'whatever'

ps ax|grep sophie
12737 ?        Ss     0:00 /usr/sbin/sophie -D
12738 ?        S      0:03 /usr/sbin/sophie -D
19591 pts/0    S+     0:00 grep --color=auto sophie

/usr/lib/nagios/plugins/check_nrpe -H 192.168.19.252 -c check_process -a sophie 1:1 1:1
PROCS CRITICAL: 3 processes with args 'sophie'

Содержимое /etc/nagios/nrpe_local.cfg в MonitorLucid / MonitorEtch:

allowed_hosts=NagiosServer,127.0.0.1
dont_blame_nrpe=1
command[check_process]=/usr/lib/nagios/plugins/check_procs -a $ARG1$ -m PROCS -w $ARG2$ -c $ARG3$

Но если я выполню проверку локально, она вернет правильные результаты!

Проверьте MonitorLucid от MonitorLucid (правильные результаты):

/usr/lib/nagios/plugins/check_procs -a whatever -m PROCS -w 1:1 -c 1:1
PROCS CRITICAL: 0 processes with args 'whatever'

/usr/lib/nagios/plugins/check_procs -a sophie -m PROCS -w 1:1 -c 1:1
PROCS CRITICAL: 2 processes with args 'sophie'

На данный момент у меня нет идей, если не считать проверки на 1 экземпляр больше, чем следовало бы.

У меня была похожая проблема. check_procs внутренне звонит /bin/ps axwo 'stat uid pid ppid vsz rss pcpu comm args', он перечисляет процессы, а затем считает их. Если вы настроили nagios для работы с другим пользователем, он использует sudo для выполнения команды. И вот в чем проблема. Если вы напечатаете sudo ps -AF | grep sudo, некоторая отдача от распределения "grep sudo", другие возвращаются"sudo ps -AF" и "grep sudo". Поскольку check_procs считает все процессы, вы получите разные результаты на разных машинах. К сожалению, у меня пока нет решения, как заставить check_procs не подсчитывать sudo процессы.

Похоже на версию check_procs в Lucid глючит (или, по крайней мере, его поведение изменилось); тот факт, что он всегда находит одну лишнюю, предполагает, что он выполняет сопоставление подстроки для любой части имени процесса и аргументов и находит один из процессов, связанных с запуском плагина. Стоит сообщить об ошибке в Ubuntu.