У меня есть Nagios, отслеживающий установку Oracle на другом сервере. Иногда один конкретный тест (проверьте, может ли табличное пространство oracle выделить следующий экстент) завершится неудачно с сообщением «КРИТИЧЕСКИЙ - Плагин истек через 10 секунд».
Первое, что я хочу сделать, это выяснить, сколько времени на самом деле требуется для завершения. Если это 11 секунд, может быть, мне все равно, и я просто хочу установить таймаут немного выше.
Я попытался установить тайм-аут для check_by_ssh, который используется для запуска самой команды, например:
define command {
command_name check_ssh_oracle_health
command_line $USER1$/check_by_ssh -H $HOSTADDRESS$ -C
"/export/home/nagios/libexec/check_oracle_health --mode=$ARG1$ --environment
ORACLE_HOME=/u01/app/oracle/product/11.2.0/dbhome_1
--connect=nagios/<pwd>@<SID> --timeout=15"
}
Это не имело никакого эффекта; тест по-прежнему выдает ошибки, и все еще говорит, что это произошло через 10 секунд (и да, я перезапустил Nagios :).
Единственное другое место, где я могу установить тайм-аут, - это nagios.cfg; это кажется слишком высоким уровнем (это повлияет на все тесты), и, кроме того, ни один из них в настоящее время не установлен на 10 секунд, поэтому я сомневаюсь, что это подходящее место.
Есть указатели?
Я думаю, что это check_by_ssh
это время ожидания (10 секунд - время ожидания по умолчанию для этой проверки), а не check_oracle_health
внутри него. Попробуйте установить тайм-аут check_by_ssh
на более высокое значение и посмотрите, происходит ли это по-прежнему.
Надеюсь это поможет!