Назад | Перейти на главную страницу

Ошибка NMI HP DL380e Gen8

У меня есть HP DL380e Gen8 с RAID-контроллером P420, он работал 24 часа в сутки на моей предыдущей работе в течение 7 месяцев без каких-либо проблем с запуском нескольких виртуальных машин. После смены работы у меня был отключен сервер дома около 3 месяцев. Я включил его сегодня после добавления сетевой карты 10Gbe (HP NC523SFP), сервер загрузился нормально, я вошел в ОС (Centos 7), и все выглядит нормально. Примерно через 45 минут я услышал, как вентилятор сервера вращается на 100%, а затем вернулся в нормальное состояние, я подключил монитор, и у меня есть красный экран смерти с ошибкой NMI. Проверка МОТ, ошибка относится к PCI- E Слот 1 Raiser card 1, к которому подключен контроллер P420 (10Gbe находится на Riser Card 1 слоте 3). Я думал, что проблема была вызвана 10Gbe, но после его удаления на сервере все еще появляется красный экран смерти. Я также попытался переместить 10Gbe в слот PCI-E на другой стороне переходной платы, но ничего не изменилось, я также попытался удалить модуль Smart Cache с аккумулятором и переместить P420 в слот 3. Что может Я проверяю? Единственное, чего я не пробовал, - это загрузиться без подключенных жестких дисков и / или кабелей объединительной платы, снятых с P420. Возможно ли, что наличие карты 10Gbe на одной стороне переходной платы сломало контроллер P420? При первой загрузке с 10Gbe я помню, что было сообщение о параметре загрузочного диска / ROM, которого я не видел раньше, и которое я полностью проигнорировал ..

Контроллеры RAID действительно часто выходят из строя, поэтому я не удивлюсь, если он просто решит умереть из-за вас.

Самый простой способ устранить эти проблемы - начать с минимальной конфигурации загрузки, которую вы обычно можете найти в руководствах по обслуживанию большинства поставщиков. По сути, это 1 ЦП, 1 флэшка ОЗУ и больше ничего не подключено. Затем вы начинаете добавлять компоненты, пока снова не получите аналогичную ошибку, и таким образом вы найдете неисправный компонент.

Также имейте в виду, что кабели являются полуактивными компонентами, я видел, как сервисные специалисты меняли материнские платы и контроллеры RAID, когда неисправным компонентом была переходная плата PCI или кабель SAS.