Назад | Перейти на главную страницу

Ложный флаг многобитных ошибок на самом высоком заполненном разъеме DIMM на втором процессоре Sunfire x2200. Неисправный процессор или неисправная материнская плата?

Я тестирую модули DIMM с регистром ECC емкостью 2 ГБ в Sunfire x2200. Недавно журнал системных событий (SEL) начал регистрировать многобитные ошибки на самом высоком заполненном сокете DIMM на CPU1. С 8 модулями DIMM на CPU1 SEL заявляет о многобитных ошибках на CPU1DIMM7. С 4 модулями DIMM на CPU1 он заявляет о многобитных ошибках на CPU1DIMM3. Этого вообще не происходит, когда заполнен только CPU0. Заметив эту закономерность, я начал пробовать модули DIMM, которые, как мне известно, находятся в рабочем состоянии (проверены другой рабочей системой), но результат все тот же.

На мой взгляд, это означает, что проблема связана либо с CPU1, либо с материнской платой. Но для производства нам нужны оба процессора, и я бы не стал списывать всю машину на непригодность. Помимо замены ЦП и повторного тестирования модулей DIMM в разъемах DIMM ЦП, есть ли способ подтвердить, что неисправен ЦП, а не материнская плата? Боюсь, что в этой ситуации может быть какой-то способ устранения неполадок, с которым я не знаком. Если да, то просветите меня, пожалуйста.