У нас есть два сервера Dell R900, развернутых у известного провайдера управляемого хостинга в США. На одном из серверов Dell R900 128 ГБ памяти (32 x 4 ГБ) заменялись 6 раз. Каждый раз, когда корпус сервера сообщает об ошибке ECC памяти в другом месте в Dell OpenManage 6.5.
Мы дважды меняли все шасси (включая процессоры) и отправляли оба в Dell для диагностики, и они утверждают, что не нашли проблемы.
Кто-нибудь испытал что-то подобное и, возможно, знает, почему дисплей шасси и OpenManage не могут согласовать расположение банка памяти сбоев?
По большей части в BIOS корпоративного уровня есть список, который поддерживает определенные PN производителя. Я видел, как обновление выбивает определенный PN, и после этого у вас возникают странные проблемы с памятью.
Текущая версия BIOS должна быть 1.2.0. Это звучит так, как будто W2K8SP2 содержит более новое обновление Intel-Microcode-Update, чем ваш текущий BIOS, или W2K8R2SP1 переходит на неисправный микрокод ... Dell не знает, что ОС может это изменить.