Назад | Перейти на главную страницу

Проблема с настройкой тайм-аута для теста Nagios

У меня есть Nagios, отслеживающий установку Oracle на другом сервере. Иногда один конкретный тест (проверьте, может ли табличное пространство oracle выделить следующий экстент) завершится неудачно с сообщением «КРИТИЧЕСКИЙ - Плагин истек через 10 секунд».

Первое, что я хочу сделать, это выяснить, сколько времени на самом деле требуется для завершения. Если это 11 секунд, может быть, мне все равно, и я просто хочу установить таймаут немного выше.

Я попытался установить тайм-аут для check_by_ssh, который используется для запуска самой команды, например:

define command {
  command_name    check_ssh_oracle_health
  command_line    $USER1$/check_by_ssh -H $HOSTADDRESS$ -C 
      "/export/home/nagios/libexec/check_oracle_health --mode=$ARG1$ --environment 
      ORACLE_HOME=/u01/app/oracle/product/11.2.0/dbhome_1 
      --connect=nagios/<pwd>@<SID> --timeout=15"
}

Это не имело никакого эффекта; тест по-прежнему выдает ошибки, и все еще говорит, что это произошло через 10 секунд (и да, я перезапустил Nagios :).

Единственное другое место, где я могу установить тайм-аут, - это nagios.cfg; это кажется слишком высоким уровнем (это повлияет на все тесты), и, кроме того, ни один из них в настоящее время не установлен на 10 секунд, поэтому я сомневаюсь, что это подходящее место.

Есть указатели?

Я думаю, что это check_by_ssh это время ожидания (10 секунд - время ожидания по умолчанию для этой проверки), а не check_oracle_health внутри него. Попробуйте установить тайм-аут check_by_ssh на более высокое значение и посмотрите, происходит ли это по-прежнему.

Надеюсь это поможет!