Назад | Перейти на главную страницу

HP RX6600 - Возможный отказ несущей платы процессора

Итак, есть сервер HP Integrity RX6600, который просто невозможно включить. Когда пользователь включает корпус, он зависает в процессе POST и не может получить доступ к EFI и загрузке ОС.

После просмотра журналов (журналов MP), которыми я поделюсь здесь, наша первая догадка была связана с ошибкой несущей платы процессора или ее модулей ЦП:

Log Entry 64: 09 Aug 2017 19:19:48
Alert Level 7: Fatal
Keyword: BOOT_NOT_DETECTED
No events were received from system firmware
Logged by: Baseboard Management Controller;
Sensor: Processor 
Data1: FRB2/Hang in POST failure
0x20598B6054020430 FFFF036F00070300

Log Entry 107: 09 Aug 2017 20:34:16
Alert Level 7: Fatal
Keyword: MISSING_FRU_DEVICE
Missing FRU device - Processor 0
Logged by: Baseboard Management Controller;
Sensor: Entity Presence - Missing Device
0x20598B71C8020700 FF20807115250300

Обычно на плате ЦП установлено 2 модуля ЦП. поэтому мы подали заявку на подержанные материалы как для модулей ЦП, так и для платы ЦП. Однако после установки новых компонентов на сервер мы практически столкнулись с той же проблемой, что означает, что сервер все еще не может обнаружить процессор 0 и, следовательно, процесс POST не может быть завершен. Мы провели несколько тестовых случаев с недавно установленными деталями:

1- Удален модуль ЦП из слота 0 и включен: произойдет сбой, мы получим те же предупреждения, а также при запросе о состоянии процессора:

Slot0: Installed and Not configured
Slot1: Installed and configured

Что я нашел это ненормальным, потому что в Slot0 нет процессора

2- Мы поменяли местами рабочий процессор в слоте 1 на слот 0: это будет неудачно, мы получим те же предупреждения, а также когда мы запросим статус процессора:

Slot0: Installed and Not configured
Slot1: Not installed

Есть ли у кого-нибудь такая проблема? Могу ли я еще что-нибудь проверить для устранения неполадок? Основываясь на результатах тестирования, можем ли мы сделать вывод, что, возможно, даже недавно приобретенная плата ЦП неисправна?

Ну, видимо, неисправна плата ЦП. мы заменили на другой, и теперь все хорошо. :)