пытается создать проверку кластера для проверки службы http на большом (~ 80 узлов) кластере. Я хотел бы предупредить @ 40+ узлов в ненормальном состоянии, критические @ 60+ узлов в неправильном состоянии.
определение команды:
define command {
command_name check_cluster
command_line $USER1$/check_cluster --service -l $ARG1$ -w $ARG2$ -c $ARG3$ -d $ARG4$
}
определение услуги:
define service {
name Laborer Clutser check
service_description laborer_cluster
hostgroup_name laborer_cluster
use generic-http-1min
check_command check_cluster!@40!@60!"laborer cluster"!$SERVICESTATEID:cs01:laborer-http$,$SERVICESTATEID:cs02:laborer-http$,$SERVICESTATEID:cs03:laborer-http$,..$SERVICESTATEID:csNN:laborer-http$
но по какой-то причине он отправляет WARN только с одним хостом в некорректном состоянии: