Уведомления, которые я получаю и не получаю от Icinga, похоже, не имеют смысла, и я надеюсь, что кто-то здесь может мне помочь. Это Icinga 1.10.1, работающая на Ubuntu 12.04.3 LTS.
Когда хост перемещается сверху вниз, он проверяет это 5 раз, а затем переходит в жесткое состояние. Журнал показывает, что процесс уведомления узла запущен, и он пытается отправить электронное письмо по электронной почте notify-host. Но ничего не выходит.
Службы ping, uptime и uplink сразу переходят в критическое и неизвестное состояние и не запускают событие notify-service-by-email.
Если у службы восходящего канала удалена одна ссылка, она переходит в состояние предупреждения, проверьте 5 раз, а затем успешно отправит уведомление по электронной почте.
Надеюсь, это не что-то очевидное, что я пропустил.
Ниже приведены мои общие шаблоны услуг, хоста и контактов, а также определения хоста и сервиса для рассматриваемого устройства.
# generic service template definition
define service{
name generic-service ; The 'name' of this service template
active_checks_enabled 1 ; Active service checks are enabled
passive_checks_enabled 1 ; Passive service checks are enabled/accepted
parallelize_check 1 ; Active service checks should be parallelized (disabling this can lead to major performance problems)
obsess_over_service 1 ; We should obsess over this service (if necessary)
check_freshness 0 ; Default is to NOT check service 'freshness'
notifications_enabled 1 ; Service notifications are enabled
event_handler_enabled 1 ; Service event handler is enabled
flap_detection_enabled 1 ; Flap detection is enabled
failure_prediction_enabled 1 ; Failure prediction is enabled
process_perf_data 1 ; Process performance data
retain_status_information 1 ; Retain status information across program restarts
retain_nonstatus_information 1 ; Retain non-status information across program restarts
max_check_attempts 5
check_interval 1
retry_interval 1
check_period 24x7
notification_interval 30
notification_period 24x7
notification_options w,u,c,r
contact_groups sys-admins
register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL SERVICE, JUST A TEMPLATE!
}
#service definitions in localhost_icinga.cfg
#check uptime
define service{
use generic-service
host_name 1.switch.foo.com
service_description Uptime Test
check_command check_snmp!public!sysUpTime.0
}
#check ping for AS5 for test notifications
define service{
use generic-service
host_name 1.switch.foo.com
service_description Ping Test
check_command check_ping!200.0,20%!600.0,60%
}
define service{
use generic-service
host_name 1.switch.foo.com
service_description Uplink Ports Check
check_command check_multi_snmp!/etc/icinga/objects/switches/1s_uplink.cmd!15
}
.
# Generic host definition template - This is NOT a real host, just a template!
define host{
name generic-host ; The name of this host template
notifications_enabled 1 ; Host notifications are enabled
event_handler_enabled 1 ; Host event handler is enabled
flap_detection_enabled 1 ; Flap detection is enabled
failure_prediction_enabled 1 ; Failure prediction is enabled
process_perf_data 1 ; Process performance data
retain_status_information 1 ; Retain status information across program restarts
retain_nonstatus_information 1 ; Retain non-status information across program restarts
check_command check-host-alive
check_interval 1
retry_interval 1
max_check_attempts 5
check_period 24x7
contact_groups sys-admins
notification_interval 30
notification_period 24x7
notification_options d,u,r
register 0 ; DONT REGISTER THIS DEFINITION - ITS NOT A REAL HOST, JUST A TEMPLATE!
}
# Define a template for switches that we can reuse
define host{
name generic-switch ; The name of this host template
use generic-host ; Inherit default values from the generic-host template
register 0 ; DONT REGISTER THIS - ITS JUST A TEMPLATE
}
#Host definition in localhost_icinga.cfg
define host{
use generic-switch ; Inherit default values from a template
host_name 1.switch.foo.com ; The name we're giving to this switch
alias S1 - HP Pro-Curve 1800-24G J9028B ; A longer name associated with the switch
address 10.1.1.242 ; IP address of the switch
hostgroups switches ; Host groups this switch is associated with
}
.
#Define a generic contact for Icinga
define contact{
name generic-contact
service_notification_period 24x7
host_notification_period 24x7
service_notification_options w,u,c,r,f,s
host_notification_options d,u,r,f,s
service_notification_commands notify-service-by-email
host_notification_commands notify-host-by-email
register 0
}
#icinga_contacts.cfg
define contact{
contact_name bob
use generic-contact
alias bob (Sysadmin)
email bob@foo.com
}
define contactgroup{
contactgroup_name sys-admins
alias System Administrator
members bob
}