Хотел опубликовать это здесь, если у кого-то еще есть эта проблема. У нас есть Dell PowerEdge R710 под управлением VMWare ESXi 4.1, мы получили сообщение ловушки SNMP через мониторинг Nagios:
ПРОВЕРКА ОБСЛУЖИВАНИЯ: theServerName; SnmpTrap; 2; маргинальный номер шасси Тип: статус шасси: маргинальный Имя: Значение «VMware Rollup Health State»: 0 233: 2: 10: 09.44
Мы нашли сообщение об этом в сообществах VMware:
Сообщение сообществ VMware о сообщении SNMP: http://communities.vmware.com/thread/345217
vmwESXEnvHardwareEvent [1] vmwSubsystemType.2 (Integer): chassis [2] vmwHardwareStatus.2 (Integer): marginal [3] vmwEventDescription.2 (DisplayString): Type: chassis Status: marginal Name: 'VMwareRollup Health State' value: 0 [4] vmwEnvHardwareTime.2 (Time Ticks): 350 days 09:16:01 [5] snmpTrapEnterprise.0 (Object ID): vmwESX
Затем ошибка исчезла через некоторое время (получена еще одна ловушка SNMP):
SERVICE ALERT: theServerNameSnmpTrap;CRITICAL;SOFT;1;chassis normal Type: chassis Status: normal Name: 'VMware Rollup Health State' value: 0 233:9:46:00.04
Что в данном случае означает «маргинальное шасси»?
В нашем случае это была батарея в Perc h700. Это было эквивалентно «Кэш-батарея 0 в контроллере 0 заряжается (готова) [вероятно, безвредна]». сообщение, идущее от получателя SNMP.
Батарея кэша заряжается время от времени, и если зарядка завершается в течение нескольких часов, все в порядке.