Назад | Перейти на главную страницу

/ var / log / messages показывает много CE Err = 0x2000 даже в неиспользуемых банках (слотах)

Недавно мне пришлось обновить старый сервер (HP ML350G5) с использованной оперативной памятью FBDIMM DDR2 (не мог получить новые, где я живу). После перезагрузки в / var / log / messages появляются ошибки CE Err = 0x2000, но система работает стабильно. Я предполагаю, что ECC обо всем позаботится.

Что не имеет смысла, так это то, что журналы ошибок показывают одну и ту же ошибку для всех банков, хотя я использую только 2 слота (слот 0 и 3).

Установленная оперативная память совместима с модулями Kingstone 2x4 ГБ, работающими на 32-битной системе Centos 5.5. Я ждал некоторого доступного времени простоя для установки ядра PAE, чтобы воспользоваться преимуществами 8 ГБ, но я не ожидал ошибок.

В других сообщениях предлагается запустить memtest, но я хотел поделиться и посмотреть, возникали ли у других подобные ошибки, указывающие на неиспользуемые слоты RAM. Могут ли ошибки быть связаны с тем, что установлено больше ОЗУ, чем может учесть 32-разрядная версия (без работы 64-разрядного ядра или ядра PAE)?

Ниже приводится образец журнала ошибок.

14 августа 21:00:35 ммм ядро: EDAC MC0: CE строка 0, канал 0, метка "": (Branch = 0 DRAM-Bank = 4 RDWR = Read RAS = 12405 CAS = 506, CE Err = 0x2000 (Correctable Non -Зеркальные данные спроса ECC))

14 августа 21:00:36 ммм ядро: EDAC MC0: CE строка 0, канал 0, метка "": (Branch = 0 DRAM-Bank = 2 RDWR = Read RAS = 3505 CAS = 4, CE Err = 0x2000 (Correctable Non -Зеркальные данные спроса ECC))

14 августа 21:00:37 ммм ядро: EDAC MC0: CE строка 0, канал 0, метка "": (Branch = 0 DRAM-Bank = 6 RDWR = Read RAS = 12404 CAS = 504, CE Err = 0x2000 (Correctable Non -Зеркальные данные спроса ECC))

... Все значения DRAM-Bank = отображаются в журналах (от 0 до 7)

если вы еще не установили ядро ​​PAE, то какое ядро ​​вы сейчас используете ???

memtest может не идентифицировать ошибки из-за того, что память является памятью ECC

попробуйте бежать edac-util -v если есть какие-либо неисправимые проблемы, вы сможете определить плохие строки памяти.

Согласно журналам, вы получаете сообщения CE (исправленная ошибка) в системе. Вы можете игнорировать их, отредактируйте grub.conf и добавьте mce = dont_log_ce в строку ядра, которая остановит исправленные сообщения об ошибках для входа в файл.

Но всегда полезно запустить проверку памяти в системе.