У меня есть сервер HP Proliant ML350 G5, в котором в одночасье произошел сбой источника питания. Блок питания был заменен, но, к сожалению, он был перезапущен с подключенным только 1 диском в наборе RAID 1 (RAID-контроллер является сборкой в E200i).
Затем рейдовый BIOS сообщил при запуске, что он перешел в режим временного восстановления. Однако я ожидал, что он по-прежнему запускается только с 1 диском. Однако в BIOS говорится, что он не может найти диск C: и входит в цикл перезагрузки, опрашивая другие загрузочные устройства. Первый вопрос: это нормальное поведение - не запускаться на 1 диске?
Затем был подключен второй диск (все диски в порядке), и raid bios запустил автоматическое восстановление на этом диске. Это похоже на фоновый процесс, так как прогресс не отображается. Однако, судя по миганию света, похоже, что он работает. Мой второй вопрос: сколько времени займет это восстановление? (Диск SAS 36 ГБ 15K).
Я не вижу сообщений об ошибках, и похоже, что диск восстанавливается нормально, но компьютер по-прежнему не запускается. В процессе загрузки по-прежнему говорится, что диск C: не найден. Если я дождусь завершения перестройки, будет ли она исправлена сама собой и найду диск C: Или тут какая-то другая проблема?
Ответы
Вот какие выводы я сделал после решения этого вопроса.
1) Нет, это ненормально. В нашей системе (как и в большинстве других), если один из дисков RAID 1 отсутствует или находится в процессе восстановления, единственный оставшийся диск все равно должен работать нормально и правильно загружаться. (Хотя контроллер действительно переходит в режим пониженной производительности.)
2) Восстановление RAID 1 в нашей системе заняло около 4,5 часов, чтобы восстановить диск после того, как он был вставлен обратно. Мне показалось, что это долгое время для диска SAS RAID 1 + 0 36 ГБ 15 тыс. Об / мин, который не использовался в время. Но это то, что потребовалось. (В качестве эксперимента я вытащил и заменил диск SAS 10 000 об / мин 146 ГБ из сопутствующего массива RAID 5 этой машины, который использует 4 диска. Это заняло менее 2 часов. Подумайте.)
3) Основная проблема, с которой я столкнулся с этой машиной, оказалась повреждением NVRAM машины. Я могу только предположить, что неисправность источника питания была причиной его повреждения. Хотя в BIOS не было явных признаков того, что что-то не так. Все настройки выглядели так, как должны быть. Однако после очистки NVRAM с помощью переключателя S6 на материнской плате система загрузилась без проблем. Я предполагаю, что указанный контроллер загрузки каким-то образом изменился в некоторых базовых настройках BIOS. (Кстати, если вы это сделаете, не забудьте сбросить дату и время, прежде чем позволить вашему серверу увлекаться получением почты и отсутствием резервных копий.)
У вас там происходит что-то странное, хотя я не совсем уверен, что это такое.
Сервер должен загрузиться и нормально работать с одним диском. Все это должен происходит, если контроллер отмечает массив как деградированный, но операционные системы не заботятся (или даже не знают) об этом состоянии и должны работать в обычном режиме.
Что касается перестройки, обычно я бы посоветовал взглянуть на утилиту HP Array Diag Utility, так как она даст вам некоторое представление о ходе перестройки. Поскольку на этом этапе операционная система выглядит неестественно, BIOS может Есть некоторые элементарные элементы настройки массивов и отображения их статуса. В противном случае вы сможете загрузиться с компакт-диска StartSmart, который содержит утилиту HP Array Diag. Диск на 36 ГБ должен восстанавливаться относительно быстро - я видел, как за утро восстанавливали RAID1 на ML370 на 36 ГБ.
Это точно BIOS говорит вам, что вы едете? C:
не найдено? C:
это очень Windows, и я был бы удивлен, что BIOS будет ссылаться на очень ориентированную на Windows вещь, когда могут быть установлены другие операционные системы (это вполне может сработать, это просто кажется мне странным).
это нормальное поведение - не запускаться на 1 диске?
Нет, не на хорошем контроллере. Вы должны работать с любым диском в аппаратном RAID1.
Мой второй вопрос: сколько времени займет это восстановление?
Это займет столько времени, сколько потребуется. Обычно это может происходить в фоновом режиме во время работы системы. Если ваша система ожидает этого, это может быть плохим знаком.
В процессе загрузки по-прежнему говорится, что диск C: не найден
Это беспокоит. Я бы хотел загрузиться с Livecd или еще чего-нибудь и посмотреть, можете ли вы увидеть какие-либо данные на дисках. Возможно, загрузчик перепутал. Надеюсь, у вас есть хорошие резервные копии.
В прошлом я видел, как сбои в блоке питания разрушают диски. Это было бы необычно, но я думаю, это могло бы стереть данные.