Один из «моих» DL165 G7 Proliants во второй раз за месяц перезагрузился совершенно неожиданно. Перезагрузка сопровождалась следующими записями журнала системных событий в LightsOut:
Event Type Date Time Source Description Direction
OEM -- -- -- 00 00 00 00 01 02 00 00 00 00 00 00 00 --
Generic 07/19/2013 16:40:38 NMI Detect State Asserted Assertion
Generic 07/19/2013 16:40:42 Gen ID 0x41 Run-time Stop Assertion
OEM 07/19/2013 16:40:42 000137 01 80 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 02 54 44 4f 00 01 --
OEM 07/19/2013 16:40:42 000137 02 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 03 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 03 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 04 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 04 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 05 00 00 00 00 01 --
OEM 07/19/2013 16:40:42 000137 05 00 00 00 00 01 --
Generic 07/19/2013 16:43:54 Gen ID 0x41 C: boot completed Assertion
OEM 07/19/2013 16:43:54 000137 00 b4 6c e9 51 00 --
Я обратился в службу поддержки HP, чтобы получить помощь в расшифровке событий, но, к сожалению, без особого успеха - мне сказали, что доступной документации нет. Что он пытается мне сказать и как узнать, что здесь сломано?
Изменить: в системе работает Hyper-V 2012. Единственное полезное событие, касающееся сброса, - это Kernel-Power / 41 с кодом BugcheckCode 128 / 0x00000080 и BugcheckParameter1 из 0x4f4454, которые соответствуют первым двум строкам OEM журнала событий iLO (после вас поменять местами байты, по крайней мере, с прямым порядком байтов). Код проверки ошибок привел меня к эта статья MSDN который прямо заявляет, что "точную причину определить сложно".
В центре поддержки HP я мог найти внешне похожее описание проблемы Решение состоит в том, чтобы синхронизировать часы между узлами кластера. Хотя мой ломающийся хост действительно работает в кластере, у меня синхронизированы часы, и я не могу воспроизвести проблему, когда часы расходятся (очевидные проблемы аутентификации Kerberos отложены в сторону, ничего особенного не происходит, если я рассинхронизирую часы).
Странная информация, которую мне удалось собрать по этой проблеме:
У меня была аналогичная проблема с HP ProLiant G380 G6 и Windows 2008 R2, копание на форумах поддержки и помощи ни к чему не привело, я в конечном итоге использовал DVD HP Smart Update Manager для установки всех последних обновлений на сервере, полтора года пока прошло без ошибок.
Это может быть долгая задача, но попробуйте использовать последние обновления, вот последний DVD HP SUM
Если вы попытаетесь запустить это на сервере 2012 года, вы можете получить ошибку, что он несовместим, по HP это нормально и вам нужно только игнорировать ошибку.
Надеюсь это поможет.