у меня примерно каждый час в IML (hplog) из записи HP DL360 G7:
CRITICAL: CPU - Uncorrectable Machine Check Exception (Board 0, Processor 1, APIC ID 0x00000003, Bank 0x00000005, Status 0xBE000000'00800400, Address 0x00003FFF'811239E0, Misc 0x00000000'00007FFF)
hpasmcli> show server
System : ProLiant DL360 G7
ROM version : P68 09/30/2010
iLo present : Yes
Может ли кто-нибудь сказать мне, на какую часть ссылаются приведенные выше коды состояния IML?
Заранее спасибо!
Обновите BIOS на сервере до текущей версии. Если это воспроизводимо с таким регулярным интервалом, это первое, что я бы попробовал.
Самый безопасный способ запустить это обновление - использовать автономный Пакет обновления HP для ProLiant DVD образ. Если нет, можете ли вы сказать нам, какая операционная система используется? Вы можете скачать определенные обновления для своего сервера отсюда.
Кроме того, это может быть проблема с системной платой. Вы можете попробовать переместить / переустановить модули DIMM, чтобы проверить, не изменится ли сообщение об ошибке (после модуля DIMM). Если это не так, скорее всего, это сокет ЦП для процессора 1. Осмотрите разъем LGA на предмет изогнутых контактов.
Вы также можете позвонить в службу поддержки HP ProLiant ...
Видеть Вот для большего количества людей, испытывающих подобную проблему.
Возможный обходной путь: в BIOS измените режим регулятора мощности на «Static High Performance».
Решение, вероятно, будет вызвано обновлением BIOS от 5 мая 2011 г .:
Решена проблема, которая может привести к любому из следующих условий: операционная система перестает отвечать, неожиданный сброс системы, синий экран при использовании операционной системы Microsoft Windows, паника ядра при использовании операционной системы Linux или фиолетовый экран при использовании VMware ESX. При возникновении этой проблемы может отображаться сообщение операционной системы или регистрироваться в журнале интегрированного управления HP (IML) с указанием «Неисправимое исключение проверки машины». Однако бывают случаи, когда система перезагружается до того, как операционная система отображает сообщение об ошибке, и случаи, когда IML не содержит записи журнала, когда возникает эта проблема. Эта проблема не возникает, если минимальное состояние простоя процессора настроено на отсутствие C-состояний или C1E-состояние.