Назад | Перейти на главную страницу

HP DL165G7: ошибка NMI

Один из «моих» DL165 G7 Proliants во второй раз за месяц перезагрузился совершенно неожиданно. Перезагрузка сопровождалась следующими записями журнала системных событий в LightsOut:

Event Type  Date    Time    Source  Description Direction
OEM --  --  --  00 00 00 00 01 02 00 00 00 00 00 00 00  --
Generic 07/19/2013  16:40:38    NMI Detect  State Asserted  Assertion
Generic 07/19/2013  16:40:42    Gen ID 0x41 Run-time Stop   Assertion
OEM 07/19/2013  16:40:42    000137  01 80 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  02 54 44 4f 00 01   --
OEM 07/19/2013  16:40:42    000137  02 00 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  03 00 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  03 00 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  04 00 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  04 00 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  05 00 00 00 00 01   --
OEM 07/19/2013  16:40:42    000137  05 00 00 00 00 01   --
Generic 07/19/2013  16:43:54    Gen ID 0x41 C: boot completed   Assertion
OEM 07/19/2013  16:43:54    000137  00 b4 6c e9 51 00   --

Я обратился в службу поддержки HP, чтобы получить помощь в расшифровке событий, но, к сожалению, без особого успеха - мне сказали, что доступной документации нет. Что он пытается мне сказать и как узнать, что здесь сломано?

Изменить: в системе работает Hyper-V 2012. Единственное полезное событие, касающееся сброса, - это Kernel-Power / 41 с кодом BugcheckCode 128 / 0x00000080 и BugcheckParameter1 из 0x4f4454, которые соответствуют первым двум строкам OEM журнала событий iLO (после вас поменять местами байты, по крайней мере, с прямым порядком байтов). Код проверки ошибок привел меня к эта статья MSDN который прямо заявляет, что "точную причину определить сложно".

В центре поддержки HP я мог найти внешне похожее описание проблемы Решение состоит в том, чтобы синхронизировать часы между узлами кластера. Хотя мой ломающийся хост действительно работает в кластере, у меня синхронизированы часы, и я не могу воспроизвести проблему, когда часы расходятся (очевидные проблемы аутентификации Kerberos отложены в сторону, ничего особенного не происходит, если я рассинхронизирую часы).

Странная информация, которую мне удалось собрать по этой проблеме:

У меня была аналогичная проблема с HP ProLiant G380 G6 и Windows 2008 R2, копание на форумах поддержки и помощи ни к чему не привело, я в конечном итоге использовал DVD HP Smart Update Manager для установки всех последних обновлений на сервере, полтора года пока прошло без ошибок.

Это может быть долгая задача, но попробуйте использовать последние обновления, вот последний DVD HP SUM

Если вы попытаетесь запустить это на сервере 2012 года, вы можете получить ошибку, что он несовместим, по HP это нормально и вам нужно только игнорировать ошибку.

Надеюсь это поможет.