Мы обновляем наш устаревший парк серверов Dell до новых Dell 13-го поколения с iDRAC 8 для предприятий.
Мы опрашиваем состояние питания сервера через SNMP со следующим OID:
.1.3.6.1.4.1.674.10892.5.2.4.0 (systemPowerState)
Это предназначено для возврата значения 4 (on)
, и часто бывает. Но он также часто возвращает состояние 0
, что вызывает срабатывание ложных предупреждений.
Кто-нибудь еще видел это на iDRAC 8? Я собираюсь открыть дело с Dell, чтобы узнать, есть ли известная проблема (это, ну, не первый раз, когда мы обнаруживаем ошибку в прошивке Dell), но я хотел увидеть, видел ли кто-нибудь еще это первым , и если у вас есть обходной путь.
После нескольких недель изучения этого решения у меня еще нет решения, но теперь мы также периодически получаем «неизвестные» данные от датчиков напряжения, говорящие о том, что шина 1,5 В отключается. Это происходит не только с одним сервером. Теперь у нас есть несколько R630, которые возвращают эти данные по SNMP и вызывают то, что мы считаем ложными.
Я оказал техническую поддержку Dell, но у меня нет разрешения.
У меня такая же проблема "Power Status" с 4x R730. Обновление прошивки до последней доступной версии (2.15.10.10_A00) не решило.
Значения SNMP, возвращаемые для DellPowerState, должны быть одним из:
1 ⇒ Другое 2 ⇒ Неизвестно 3 ⇒ Выкл. 4 ⇒ Вкл.
0 не задокументировано. Обход, который мы используем, состоит в том, чтобы рассматривать «0» как «4», поэтому мы не получаем предупреждения, когда idrac случайным образом возвращает «0».
Думаю, нам придется дождаться будущей версии прошивки idrac от Dell, чтобы исправить это.