Любое представление о том, что это за ошибка E211 SBE LOG DISABLE DIMM6
может означать? Кто-нибудь испытал это?
Я знаю, что это звучит довольно очевидно, это 6-й банк моей памяти, и гость, что:
Это может быть другой компонент или проблема с прошивкой?
Dell тоже проверяет, но ничего не нашла в системных журналах, созданных OMSA.
Явным признаком является то, что ошибка начинается через час работы. Операционная система на этом оборудовании - ESXi 5.0.1. Никакого сбоя системы из-за этой ошибки не произошло.
Редактировать: Я почистил логи биоса через /opt/dell/dset/clearesm.sh
(OMSA liveCD) на новом mobo, перезагрузился в memtest + (все еще на livecd), и через 20 минут на дисплее появилось сообщение об ошибке, и memtest не обнаружил ошибок ...
Изменить 2: ./dcicfg32 command=clearmemfailures
ни очистка BCM в Bios (Control + E во время публикации -> Меню журнала системных событий -> Очистить журнал системных событий), похоже, не решает вопрос. Через 20 минут работы ошибка возвращается.
Изменить 3: MOBO был изменен (см. Выше), и у обоих была одна и та же ошибка. Перестановка позиций памяти или использование памяти другого сервера 2950 ничего не меняет при ошибке.
Это указывает на то, что однобитовая ошибка (SBE) произошла в DIMM 6 с такой частотой, что система больше не регистрирует ошибку, пока не будет перезагружена. (Видеть https://support.quest.com/SolutionDetail.aspx?id=SOL60022 для фона.)
Немного озадачивает то, что вы видите ту же ошибку после замены материнской платы, но возможно, что замененная плата имеет тот же дефект, что и первая плата. Поскольку вы переставили модули DIMM, а проблема не связана с модулем DIMM, я с меньшей вероятностью заподозрю DIMM.
Я бы использовал соответствующую диагностику Dell MpMemory для этого сервера, а не memtest +. Инструмент Dell будет знать обо всех аппаратных функциях Dell.
Один вопрос, когда вы сказали «попробуйте очистить журналы mobo», имеете ли вы в виду журналы BMC (журналы оборудования) или сбросить счетчик ошибок памяти, если вы говорите о BMC, что вам нужно сделать это просто чистый счетчик SBE, по крайней мере, чтобы убедиться, что это не ложное предупреждение.
Чтобы очистить счетчик журналов SBE, вы можете запустить следующую команду "./dcicfg32 command = clearmemfailures" с LIveCD.