Назад | Перейти на главную страницу

Зарегистрированные события машинной проверки

В / var / log / messages произошла эта ошибка:

Sep 19 13:18:15 wdc kernel: [2772302.630416] Machine check events logged

Вскоре после этого весь сервер перестал отвечать. Это находится в журнале Dom0 для сервера Xen (под управлением последней версии Debian Squeeze).

Может ли кто-нибудь пролить свет на то, что означает эта ошибка? Следует ли мне заказывать новое оборудование?

Изменить: Кроме того, похоже, что он что-то зарегистрировал, где я могу это найти?

Для получения дополнительной информации проверьте файл журнала (этот файл журнала может быть там, а может и не быть, это зависит от того, как он настроен в /etc/mcelog/mcelog.conf), где должно быть подробное описание обнаруженной проблемы.

/var/log/mcelog

или просто запустите команду

mcelog


Mcelog декодирует журнал проверки машины ядра на машинах x86. Из man mcelog:

X86  CPUs  report  errors  detected by the CPU as machine check events (MCEs).  These
can be data corruption detected in the CPU caches, in main memory by an integrated
memory controller, data transfer errors on the front side bus or CPU interconnect or
other internal errors. Possible causes can be cosmic radiation, instable power
supplies, cooling problems, broken hardware, or bad luck.
Most  errors  can  be  corrected by the CPU by internal error correction mechanisms.
Uncorrected errors cause machine check exceptions which may panic the machine.
When a corrected error happens the x86 kernel writes a record describing the MCE into
a internal ring buffer available through  the  /dev/mcelog device  mcelog retrieves
errors from /dev/mcelog, decodes them into a human readable format and prints them on
the standard output or optionally into the system log.


Вы можете найти дополнительную информацию о mcelog и его конфигурации / ошибках / триггерах на веб-странице проекта. Веб-страница проекта Mcelog

mcelog был удален в Debian 10+ (Buster) и Ubuntu 18.04+

Функционал заменен на rasdaemon.

Записи в журнале были написаны mcelog. Его лог-файл можно найти в /var/log/mcelog, или, в зависимости от системы, дополнительно в системном журнале или журнале systemd.

Процессоры X86 могут обнаруживать и иногда исправлять аппаратные ошибки (ошибки памяти, ввода-вывода и аппаратные ошибки ЦП). mcelog извлекает эти ошибки из /dev/mcelog, куда потом пишет ядро ​​линукса.

Поскольку ваша система вышла из строя, исправление оборудования, вероятно, не удалось. Если система продолжает работать, кажется, что автокоррекция работает.

Для получения дополнительной информации о последствиях просмотра таких сообщений см. В системном журнале появляется сообщение «mce: [Ошибка оборудования]: зарегистрированы события проверки компьютера». Что я должен делать?