Последние несколько дней я настраивал подержанный сервер Dell PowerEdge 2950. Он работал нормально до сих пор, когда внезапно остановился при выполнении довольно тяжелой задачи (svnadmin verify
). На ЖК-дисплее было и отображается следующее сообщение:
PowerEdge 2950 E1422 CPU Machine Chk E2118 Fatal NB Mem CRC
Теперь ошибка памяти E2118 кажется очевидной. Вероятно, один из банков сломан. Я сейчас запускаю мемтест. Обновить: Ну, memtest ошибок не обнаружил, значит, нет который легко.
E1422, меньше так. Это, скорее всего, отдельная проблема или просто результат Е2118? При поиске в Google этого кода говорится: «Обновите BIOS», что не очень конкретно указывает на причину проблемы.
E1422 CPU Machine Chk
означает, что ЦП обнаружил аппаратную ошибку и остановил работу. Это может быть связано с другой ошибкой - проблемой памяти.
Если у ЦП или памяти возникла проблема, например, проблема с регулированием напряжения, это может привести к падению напряжения на общей шине между памятью и ЦП и отказом их обоих. На прошлой неделе я читал некоторые примечания к выпуску для другой модели сервера Dell (возможно, R710), где проблемы могут быть вызваны тем, что Intel SpeedStep изменяет скорость процессора и есть задержка до того, как память скорректирует скорость. Это создало условие, при котором в промежутке времени могла произойти ошибка. В этом конкретном случае эту проблему решило обновление BIOS.
Запустите тест ЦП и тест памяти, чтобы увидеть, сможете ли вы воссоздать ошибку. Если да, возможно, вы сможете сузить круг вопросов до одного или другого компонента.