У меня есть 3 IBM X3650 с балансировкой нагрузки (циклический перебор) с Red Hat Enterprise 4.8. Один из них имеет периодические паники ядра и сообщает об ошибке в 2 конкретных банках памяти (3 и 5), которые пусты. У меня есть только модуль памяти в банках 1,4,7 и 10. Я безуспешно пытался заменить все модули памяти.
Если это идентичные машины, и вы можете позволить себе простой, рассмотрите возможность выключения «плохого» сервера и рабочего сервера, замены их дисков, их повторного включения и проверки, перемещается ли проблема с дисками или остается с оборудованием. Если в первом случае у вас проблема с диском / ОС, во втором - проблема с оборудованием.
На этой неделе у нас была аналогичная проблема с x3650 (M / T: 7979)
Мы использовали BIOS версии 1.03 (которая поставляется вместе с системой). Служба поддержки рекомендовала обновить BIOS - у нас было две системы с одинаковой настройкой балансировки нагрузки, но конфигурации менялись. На одном сервере была версия BIOS 1.15, а на другом была установлена очень старая версия BIOS. Система BIOS более старой версии вызвала проблемы.
В Журнал изменений BIOS ссылается на несколько проблем, которые были исправлены в отношении памяти. Я рекомендую обновить BIOS с помощью updateXpress или Bootable Media Creator. Если это не сработает, наберите 1800IBMSERV.
Вы можете проверить свою версию BIOS, установив IBM DSA (доступно на исправить центральный) и запущена (как root)
./opt/IBM/DSA/bin/biosversion
Паника ядра обычно указывает на аппаратную проблему.
Банки 3 и 5 пустые: вы пробовали очистить (сжатым воздухом, (с высокого положения, чтобы не повредить карту)) область слотов памяти?
Если на трех машинах одинаковая версия ядра, конфигурация и программное обеспечение, похоже, что это проблема материнской платы: идентична ли версия прошивки на трех материнских платах?
Да, ошибки из-за несуществующих модулей DIMM действительно выглядят как неисправность материнской платы. Но может быть проще сначала попробовать обновить BIOS. AFAIK x3650 BIOS позволяет снизить скорость памяти, что тоже стоит попробовать.