Назад | Перейти на главную страницу

Nagios / NRPE работают только на некоторых узлах

Я написал специальную проверку в bash и запустил ее на 4 разных серверах. Два из них работают нормально, а два других не работают при проверке наличия файла с помощью:

if [ ! -f $LOGFILE ]

Под "провалом" я подразумеваю, что на этих двух серверах сценарий решил, что $LOGFILE не существует (что неверно).

Все четыре сервера имеют одинаковую конфигурацию, разрешения и т. Д. Файл существует на всех серверах. При ручном запуске ошибки нет. При запуске вручную как nagios или nrpe пользователи, ошибки нет. Он не работает только при удаленном запуске через nagios с check_nrpe -H ... -c ...

Я подумал, что, возможно, мои навыки bash немного устарели, поэтому я переписал проверку на Python. Сейчас, те же два сервера выходят из строя, но ошибка

NRPE: Unable to read output

Опять же, версия Python на всех серверах. Однако я обнаружил, что серверы с ошибкой отображают это сообщение:

$ sudo grep nagios /var/log/messages
Jul 19 11:09:15 app-a abrt: detected unhandled Python exception in '/usr/local/nagios/libexec/check_redirects'

Как я уже сказал, я уже проверил различия в конфигурации nagios (как на мастере nagios, так и на клиентах), в разрешениях, в версиях python ... Все кажется одинаковым.

Я нашел много вопросов о том, что разные проверки работают / не работают на одном сервере. Это точно такая же проверка, работающая на одних серверах, но не на других.

Любые мысли были бы очень признательны. Спасибо.