Назад | Перейти на главную страницу

IBM X3650 с ядром Red Hat Enterprise 4.8 вызывает панику с ошибкой при пустом банке памяти

У меня есть 3 IBM X3650 с балансировкой нагрузки (циклический перебор) с Red Hat Enterprise 4.8. Один из них имеет периодические паники ядра и сообщает об ошибке в 2 конкретных банках памяти (3 и 5), которые пусты. У меня есть только модуль памяти в банках 1,4,7 и 10. Я безуспешно пытался заменить все модули памяти.

Если это идентичные машины, и вы можете позволить себе простой, рассмотрите возможность выключения «плохого» сервера и рабочего сервера, замены их дисков, их повторного включения и проверки, перемещается ли проблема с дисками или остается с оборудованием. Если в первом случае у вас проблема с диском / ОС, во втором - проблема с оборудованием.

На этой неделе у нас была аналогичная проблема с x3650 (M / T: 7979)

Мы использовали BIOS версии 1.03 (которая поставляется вместе с системой). Служба поддержки рекомендовала обновить BIOS - у нас было две системы с одинаковой настройкой балансировки нагрузки, но конфигурации менялись. На одном сервере была версия BIOS 1.15, а на другом была установлена ​​очень старая версия BIOS. Система BIOS более старой версии вызвала проблемы.

В Журнал изменений BIOS ссылается на несколько проблем, которые были исправлены в отношении памяти. Я рекомендую обновить BIOS с помощью updateXpress или Bootable Media Creator. Если это не сработает, наберите 1800IBMSERV.

Вы можете проверить свою версию BIOS, установив IBM DSA (доступно на исправить центральный) и запущена (как root)

./opt/IBM/DSA/bin/biosversion

Паника ядра обычно указывает на аппаратную проблему.

Банки 3 и 5 пустые: вы пробовали очистить (сжатым воздухом, (с высокого положения, чтобы не повредить карту)) область слотов памяти?

Если на трех машинах одинаковая версия ядра, конфигурация и программное обеспечение, похоже, что это проблема материнской платы: идентична ли версия прошивки на трех материнских платах?

Да, ошибки из-за несуществующих модулей DIMM действительно выглядят как неисправность материнской платы. Но может быть проще сначала попробовать обновить BIOS. AFAIK x3650 BIOS позволяет снизить скорость памяти, что тоже стоит попробовать.