Внезапно источник питания сервера начал плохо пахнуть. Сломался один из блоков питания с горячей заменой. Мы заменили его, загрузили Windows Server 2003 и обнаружили, что 2 из 4 дисков в конфигурации RAID 5 вышли из строя.
Мы также время от времени получаем BSOD MACHINE_CHECK_EXCEPTION от всех.
Насколько реально то, что блок питания сделал это с RAID? Было подтверждено, что RAID работает за несколько минут до того, как это произошло (мы использовали RAID прямо перед тем, как заметили ужасный запах).
Спасибо за любой совет! :)
Хотя этого не должно происходить с хорошо спроектированным блоком питания, на самом деле это происходит слишком часто. По мере того, как устройство умирает, оно может потерять способность регулирования напряжения, что приведет к перенапряжению, подаваемому на устройство. Если в результате у вас есть хорошо приготовленные диски, вам нужно быть готовым к тому, что другие компоненты тоже выйдут из строя. В идеале сервер должен быть отключен от сети и пройти стресс-тестирование, но у кого есть инструменты для этого в наши дни?
Предполагая, что у вас есть резервные блоки питания, а не просто один блок с горячей заменой, вам также рекомендуется приобрести еще один кабель питания. В конце концов, нет смысла иметь такое снаряжение, если вы не собираетесь его правильно использовать.
Хотя возможно, что плохой источник питания потенциально может повредить компоненты, я думаю, что это маловероятно. Если бы эти два привода были единственными двумя приводами на определенной линии питания, я бы подозревал, что источник питания мог послать по этой линии более 12 В. В противном случае более вероятно, что в вашем массиве было несколько неисправных дисков, о которых вы не знали. Их отключение только проявило проблему. Каждый раз, когда вы останавливаете привод, который вращался без остановки годами, вы рискуете, что он не перезапустится должным образом.
Это может случиться, поэтому рекомендуется иметь резервные источники питания на сервере и / или контроллере RAID с установленным BBU.