У меня в dmesg есть спам, содержащий:
kernel:EDAC MC0: UE page 0x0, offset 0x0, grain 1073741824, row 3, labels ":": i3200 UE
Есть идеи, что должно быть неправильным?
вот загруженные модули:
# lsmod | grep edac
i3200_edac 3330 0
edac_core 46581 2 i3200_edac
edac-util не показывает ошибок
# edac-util -v
mc0: 0 Uncorrected Errors with no DIMM info
mc0: 0 Corrected Errors with no DIMM info
mc0: csrow0: 0 Uncorrected Errors
mc0: csrow0: ch0: 0 Corrected Errors
mc0: csrow0: ch1: 0 Corrected Errors
mc0: csrow1: 0 Uncorrected Errors
mc0: csrow1: ch0: 0 Corrected Errors
mc0: csrow1: ch1: 0 Corrected Errors
mc0: csrow2: 0 Uncorrected Errors
mc0: csrow2: ch0: 0 Corrected Errors
mc0: csrow2: ch1: 0 Corrected Errors
mc0: csrow3: 0 Uncorrected Errors
mc0: csrow3: ch0: 0 Corrected Errors
mc0: csrow3: ch1: 0 Corrected Errors
mc0: csrow4: 0 Uncorrected Errors
mc0: csrow4: ch0: 0 Corrected Errors
mc0: csrow4: ch1: 0 Corrected Errors
mc0: csrow5: 0 Uncorrected Errors
mc0: csrow5: ch0: 0 Corrected Errors
mc0: csrow5: ch1: 0 Corrected Errors
mc0: csrow6: 0 Uncorrected Errors
mc0: csrow6: ch0: 0 Corrected Errors
mc0: csrow6: ch1: 0 Corrected Errors
mc0: csrow7: 0 Uncorrected Errors
mc0: csrow7: ch0: 0 Corrected Errors
mc0: csrow7: ch1: 0 Corrected Errors
похоже, это ошибка памяти, но не фатальная.
echo 0 > /sys/module/edac_core/parameters/edac_mc_log_ce
предотвратит рассылку спама на консоли до следующей перезагрузки.
В основном ce_errors - это сокращение от исправимых ошибок (иначе говоря, отсутствие "дефекта" вне оперативной памяти).
видеть документ ядра о edac и edac вики Больше подробностей.
Хотя я могу совершенно ошибаться, у нас есть сервер с этим (ОЗУ ECC), и, поскольку нет неисправимых ошибок, и memdisk не показывал никаких проблем, либо я позволил ему работать с той же оперативной памятью, изменил вывод, начал отслеживать неисправимые ошибки и для нас больше не было проблем.