После перезагрузки хоста SuSE 12 я заглянул в dmesg
и наткнулся на информацию
GHES: HEST is not enabled!
GHES, очевидно, означает «Поддержка APEI Generic Hardware Error Source». Следует ли включить GHES / HEST? Как насчет пользы от этого? Как этого добиться, если это целесообразно?
У меня есть несколько машин SLES в производстве, и я никогда ими не пользовался. Вот хороший обзор: https://firmware.intel.com/sites/default/files/resources/A_Tour_beyond_BIOS_Implementing_APEI_with_UEFI_White_Paper.pdf
Таблица источников аппаратных ошибок (HEST) Таблица HEST позволяет микропрограммному обеспечению хоста объявлять все ошибки, которые компонент платформы может генерировать, и сигнализировать об ошибках для них. Микропрограммное обеспечение хоста должно создавать записи об источнике ошибок в HEST для каждого компонента (например, процессора, устройства PCIe, моста PCIe и т. Д.) И каждого типа ошибки с соответствующим механизмом уведомления об ошибках (выделением) для ОС. Эти записи об ошибках включают архитектурные ошибки x86, стандартные отраслевые ошибки и общий источник аппаратных ошибок для ошибок платформы. Ошибки архитектуры x86, MCE и CMC, а также стандартные ошибки PCIe AER, MSI и PCI INTx могут обрабатываться ОС изначально. Общий источник аппаратных ошибок может использоваться для всех первых ошибок прошивки и ошибок платформы (таких как память, логика платы), которые не имеют собственной сигнализации ОС, поэтому они должны использовать сигнализацию платформы SCI или NMI.
Думаю, если вы действительно хотите отслеживать все аппаратные ошибки, это может быть полезно.