Недавно мне пришлось обновить старый сервер (HP ML350G5) с использованной оперативной памятью FBDIMM DDR2 (не мог получить новые, где я живу). После перезагрузки в / var / log / messages появляются ошибки CE Err = 0x2000, но система работает стабильно. Я предполагаю, что ECC обо всем позаботится.
Что не имеет смысла, так это то, что журналы ошибок показывают одну и ту же ошибку для всех банков, хотя я использую только 2 слота (слот 0 и 3).
Установленная оперативная память совместима с модулями Kingstone 2x4 ГБ, работающими на 32-битной системе Centos 5.5. Я ждал некоторого доступного времени простоя для установки ядра PAE, чтобы воспользоваться преимуществами 8 ГБ, но я не ожидал ошибок.
В других сообщениях предлагается запустить memtest, но я хотел поделиться и посмотреть, возникали ли у других подобные ошибки, указывающие на неиспользуемые слоты RAM. Могут ли ошибки быть связаны с тем, что установлено больше ОЗУ, чем может учесть 32-разрядная версия (без работы 64-разрядного ядра или ядра PAE)?
Ниже приводится образец журнала ошибок.
14 августа 21:00:35 ммм ядро: EDAC MC0: CE строка 0, канал 0, метка "": (Branch = 0 DRAM-Bank = 4 RDWR = Read RAS = 12405 CAS = 506, CE Err = 0x2000 (Correctable Non -Зеркальные данные спроса ECC))
14 августа 21:00:36 ммм ядро: EDAC MC0: CE строка 0, канал 0, метка "": (Branch = 0 DRAM-Bank = 2 RDWR = Read RAS = 3505 CAS = 4, CE Err = 0x2000 (Correctable Non -Зеркальные данные спроса ECC))
14 августа 21:00:37 ммм ядро: EDAC MC0: CE строка 0, канал 0, метка "": (Branch = 0 DRAM-Bank = 6 RDWR = Read RAS = 12404 CAS = 504, CE Err = 0x2000 (Correctable Non -Зеркальные данные спроса ECC))
... Все значения DRAM-Bank = отображаются в журналах (от 0 до 7)
если вы еще не установили ядро PAE, то какое ядро вы сейчас используете ???
memtest может не идентифицировать ошибки из-за того, что память является памятью ECC
попробуйте бежать edac-util -v
если есть какие-либо неисправимые проблемы, вы сможете определить плохие строки памяти.
Согласно журналам, вы получаете сообщения CE (исправленная ошибка) в системе. Вы можете игнорировать их, отредактируйте grub.conf и добавьте mce = dont_log_ce в строку ядра, которая остановит исправленные сообщения об ошибках для входа в файл.
Но всегда полезно запустить проверку памяти в системе.