Я стараюсь быть максимально ясным: мой мозг вот-вот взорвется, как взрывающиеся котята.
Обе машины Centos 7:
[root@192.168.10.2]# cat /proc/version
Linux version 3.10.0-693.11.6.el7.x86_64 (builder@kbuilder.dev.centos.org) (gcc version 4.8.5 20150623 (Red Hat 4.8.5-16) (GCC) ) #1 SMP Thu Jan 4 01:06:37 UTC 2018
И последний NRPE от EPEL:
[root@192.168.10.1]# ./check_nrpe -H 192.168.10.2
NRPE v3.2.0
Я пытаюсь перезапустить службу с сервера nagios, поэтому могу установить обработчик событий. Все началось с большого количества скриптов, но теперь я свел проблему к следующему:
[root@192.168.10.1]# ./check_nrpe -H 192.168.10.2 -c restart
NRPE: Unable to read output
[root@192.168.10.1]# ./check_nrpe -H 192.168.10.2 -c status
(... correct service status output ...)
Loaded: loaded (/usr/lib/systemd/system/cachefilesd.service
(... correct service status output ...)
Итак, я могу отслеживать службы, но не могу запустить или перезапустить.
[root@192.168.10.2]# cat /etc/nagios/nrpe.conf:
[...]
nrpe_user=nrpe
nrpe_group=nrpe
allowed_hosts=127.0.0.1,192.168.10.1
command[status]=/lib64/nagios/plugins/status.sh
command[restart]=/lib64/nagios/plugins/restart.sh
[...]
[root@192.168.10.2]# cat /lib64/nagios/plugins/status.sh
#!/bin/bash
sudo systemctl status cachefilesd
exit 0
и
[root@192.168.10.2]# cat /lib64/nagios/plugins/restart.sh
#!/bin/bash
sudo systemctl restart cachefilesd
exit 0
sudoers:
[root@192.168.10.2]# cat /etc/sudoers
# Defaults specification
Defaults: nrpe !requiretty
Defaults: nagios !requiretty
nagios ALL = NOPASSWD: /sbin/service,/usr/bin/systemctl,/usr/sbin/service
nrpe ALL = NOPASSWD: /sbin/service,/usr/bin/systemctl,/usr/sbin/service
Если я наберу:
[root@192.168.10.2]# sudo -u nrpe -H ./restart-cachefilesd.sh
Все хорошо.
Я включил отладку в NRPE и получаю:
nrpe[5431]: Host address is in allowed_hosts
nrpe[5431]: Host 192.168.10.1 is asking for command 'restart' to be run...
nrpe[5431]: Running command: /lib64/nagios/plugins/restart.sh
nrpe[5432]: WARNING: my_system() seteuid(0): Operation not permitted
nrpe[5431]: Command completed with return code 0 and output:
nrpe[5431]: Return Code: 3, Output: NRPE: Unable to read output
nrpe[5431]: Connection from 192.168.10.1 closed.
Я пытался strace
вывод, но для меня это слишком ...
Вместо того, чтобы помещать sudo внутрь сценария, вы должны включить sudo в файл nrpe.cfg:
command[status]=sudo /lib64/nagios/plugins/status.sh
вместо того
command[status]=/lib64/nagios/plugins/status.sh