Назад | Перейти на главную страницу

Переворачивание битов - обнаружение и причины

Около недели назад я столкнулся с одной очень интересной ситуацией. У меня была рабочая станция - старый настольный компьютер с материнской платой Asus P5LD2 и 4 х 1 ГБ незарегистрированной памяти DDR2 Kingston. Эта же машина была жертвой силового удара некоторое время назад, 12-14 месяцев назад, IIRC. В момент удара power сгорел БП и сдох HDD. Заменил оба, провел тесты, в том числе memtest и вроде все нормально. Пользователь с удовольствием работал над этим до тех пор, пока однажды на прошлой неделе он не обнаружил недавние «повреждения» данных в некоторых своих файлах. Я исследовал проблему и сумел сузить ее до неисправности материнской платы. Однако «порча данных» была довольно интересной и воспроизводимой:

Вывод из тестов - переключение битов происходит только на этой конкретной машине, независимо от используемого набора памяти и расположения данных (локальное или NFS).

Основываясь на всех моих тестах, единственные компоненты, оставшиеся в уравнении, - это материнская плата и процессор.

Мои вопросы:

  1. что вызывает переворачивание битов и как именно это происходит ?;
  2. есть ли способ его обнаружить ?;
  3. как проверить / исследовать это, когда memtest не удается?

У меня все еще есть эта проблемная машина, и я готов провести любые тесты, чтобы узнать об этом больше.

Операционная система - Ubuntu Lucid 10.04, 64-разрядная версия.

редактировать Я забыл упомянуть, что большинство (если не все) конденсаторы на МБ были загнуты сверху, а не плоские.

Похоже, проблема связана с доступом ЦП к периферийным устройствам, таким как контроллер диска и сетевая карта. Это мог быть перегрев северного моста. Когда процессор горячий, северный мост нагревается сильнее, чем в противном случае. Также это может быть перегрев процессора.

Во время memtest минимальные операции ввода-вывода и минимальная нагрузка на процессор.

Я забыл упомянуть, что большинство (если не все) конденсаторы на МБ были загнуты сверху, а не плоские.

Это приведет к тому, что питание постоянного тока, подаваемое на такие компоненты, как ОЗУ, ЦП и северный мост, станет шумным при увеличении нагрузки. Это легко могло быть причиной вашей проблемы. Я бы сказал, что материнская плата должна быть списана.