Назад | Перейти на главную страницу

Nagios CHECK_NRPE: Ошибка при получении данных от демона. RHEL 6

Итак, я пытаюсь настроить службу Nagios check_load на сервере Red Hat. Я следовал документации Red Hat, чтобы установить клиент NRPE: https://access.redhat.com/documentation/en-US/Red_Hat_Enterprise_Linux_OpenStack_Platform/3/html/Installation_and_Configuration_Guide/Installing_and_Configuring_NRPE.html

В графическом интерфейсе Nagios я получаю следующее:

CHECK_NRPE: Error receiving data from daemon.

Но когда я вхожу на сервер Nagios для отладки, похоже, что я могу запустить это нормально с терминала:

root@portalmon:/Nagios# /usr/local/nagios/libexec/check_nrpe -H 10.0.XX.XXX -c check_load -t 30
OK - load average: 0.15, 0.10, 0.04|load1=0.150;15.000;30.000;0; load5=0.100;10.000;25.000;0; load15=0.040;5.000;20.000;0;

Так что я не думаю, что это проблема с разрешениями. Я думаю, что это какая-то проблема с путями, но я не могу понять, почему это не работает. Кто-нибудь может помочь?

Вот описание моей услуги:

define service{
  use                 dev-service
  host_name           [DEV] Luminis Admin DEV Portal
  service_description CPU-Load
  check_command       check_nrpe!"check_load"
}

Мне интересно, вызываю ли я ту же службу, когда запускаю указанную выше команду терминала.

РЕДАКТИРОВАТЬ: В проблеме разобрался. Сейчас работаем над разрешением. Я переключил Nagios в режим отладки и, посмотрев на /usr/local/nagios/var/nagios.debug, понял, что выполняемая команда

/usr/local/nagios/libexec/check_nrpe -n -t 60 -H <hostname> -c check_load

вместо того

/usr/local/nagios/libexec/check_nrpe -H 10.0.XX.XXX -c check_load -t 30

Итак, что-то добавляет "-n", и это вызывает проблемы. Вторая команда возвращает то, что я хочу, но первая возвращает

CHECK_NRPE: Error receiving data from daemon.

РЕДАКТИРОВАТЬ 2: Разобрался, но у меня недостаточно репутации, чтобы представить его как действительный ответ, поэтому ниже я напечатал.

Я смог решить свою проблему. Вот что я сделал.

  1. В Nagios.cfg я включил режим отладки и нашел расположение файла отладки.
  2. Реплицирует проблему при ведении журнала отладки. Выяснилось, что команда Nagios отличается от той, которую я ожидал. Добавлялся флаг Нет SSL (-n).
  3. В commands.cfg я искал check_nrpe. Выяснилось, что он выполняет команду с -n. Была еще одна команда под названием check_secure_nrpe, которая запускает check_nrpe без флага -n.
  4. Отредактировал описание моей службы, чтобы использовать check_secure_nrpe вместо check_nrpe.
  5. Перезапустил Nagios.

Теперь служба работает должным образом.

Я смог решить свою проблему. Вот что я сделал.

  1. В Nagios.cfg я включил режим отладки и нашел расположение файла отладки.
  2. Реплицирует проблему при ведении журнала отладки. Выяснилось, что команда Nagios отличается от той, которую я ожидал. Добавлялся флаг Нет SSL (-n).
  3. В commands.cfg я искал check_nrpe. Выяснилось, что он выполняет команду с -n. Была еще одна команда под названием check_secure_nrpe, которая запускает check_nrpe без флага -n.
  4. Отредактировано описание моей службы, чтобы использовать check_secure_nrpe вместо check_nrpe.
  5. Перезапустил Nagios.

Теперь служба работает должным образом.

Ваш ответ очень помогает, спасибо.

Есть другое решение. Вы можете редактировать objects/commands.cfg, и удалить -n из check_nrpe команда.

Таким образом вы можете продолжать использовать check_nrpe вместо check_secure_nrpe