У меня есть блок HyperV, который показывает плохие блоки на одном из дисков. Я получил это с diskpart;
DISKPART> list disk
Disk ### Status Size Free Dyn Gpt
-------- ------------- ------- ------- --- ---
Disk 0 Online 148 GB 4096 MB
Disk 1 Online 1863 GB 0 B *
Disk 2 Online 1863 GB 0 B *
Disk 3 Errors 1863 GB 0 B *
Я набрал;
sel disk 3
offline disk
online disk
А теперь он отображается просто как онлайн. Этого достаточно? Предположительно, это может обойти один или два плохих блока. Есть ли способ переформатировать сбой и повторно синхронизировать его с массивом из командной строки. Придется ли мне его немедленно заменить?
Обновление - после ремонта по-прежнему отображается "Failed Rd"
Итак, используя запасной кабель, я подключил новый дополнительный жесткий диск. По-видимому, я должен оставить существующий модуль на месте, поскольку он не может восстановить массив с отсутствующим диском (я не знаю, почему - это, казалось бы, было сутью). Затем я сделал следующее, чтобы инициализировать его;
sel disk 4
convert dynamic
затем восстановить массив;
sel vol 0
repair disk=4
Насколько я понимаю, это предполагается использовать новый диск 4
восстановить массив без неисправного диска 3
. И, как и ожидалось, я понял это;
DISKPART> list vol
Volume ### Ltr Label Fs Type Size Status Info
---------- --- ----------- ----- ---------- ------- --------- --------
* Volume 0 E E_RAID5_4TB NTFS RAID-5 3726 GB Rebuild
Volume 1 C C_BOOT(MIR) NTFS Partition 39 GB Healthy System
Volume 2 D D_DATA(MIR) NTFS Partition 52 GB Healthy
Volume 3 G G_IMAGES(MI NTFS Partition 52 GB Healthy Boot
Однако примерно через 12-24 часа массив вернулся к Failed Rd
и 1863 свободного места на новом диске. Я пробовал уже дважды с теми же результатами. Я сейчас пробую попроще recover
команда, но я ожидаю того же результата.
В течение последнего десятилетия или около того, это был мой опыт работы с RAID. Для персональных серверов, где частота отказов дисков относительно невелика (примерно каждые 2–3 года в среднем), я определенно придерживаюсь мнения, что Windows RAID менее проблематичен, чем любой аппаратный контроллер, который всегда кажется устаревшим к тому времени, когда я нужно использовать для восстановления. Однако я не думаю, что мне когда-либо удавалось легко восстановить RAID-массив с помощью аппаратного ИЛИ программного обеспечения и осуществить мечту так, как было обещано.
Когда (как я ожидал) recover
команда не может восстановить диск, я попытаюсь физически установить новый жесткий диск вместо вышедшего из строя диска и попытаться таким образом подключить его к сети. Я смутно припоминаю, что делал нечто подобное в прошлый раз.
Я был бы признателен за дальнейшие советы в этой ситуации, даже если они напоминают мне шаги по замене физического диска.
Как всегда, по моему опыту, процесс восстановления не работает в том виде, в каком он задокументирован.
Я решил это, клонировав неисправный диск на новый, а затем физически подключив его вместо вышедшего из строя. Затем я выпустил diskpart recover
команда (которая, как мне кажется, является сокращением для repair
.
Мне удалось сделать это без загрузочных компакт-дисков восстановления ISO и внешнего оборудования следующим образом;
1) Вставьте новый диск (используя запасной порт). И обратите внимание на идентификатор диска. Убедитесь, что он не в сети.
2) Полностью отключите том RAID; sel vol 0
REM Remove drive letter association - you may need to shut...
REM ...down any services using this
remove
offline vol
3) Найдите физический диск, на котором произошел сбой. detail vol
подскажет, какие диски в томе, list vol
покажет, какой идентификатор диска содержит ошибки. Все мои диски идентичны модели, поэтому я физически вытащил кабель SATA, подождал несколько секунд и выпустил list disk
еще раз, чтобы увидеть, какой идентификатор диска отсутствует. И принял это к сведению. Тогда в моем случае;
sel disk 3
offline disk
4) Чтобы клонировать диск в достаточной степени, чтобы окна можно было обмануть, думая, что новый диск был просто отремонтированным старым диском, я подозревал, что он должен иметь такую же подпись диска, поэтому мне нужна была копия сектора низкого уровня.
Большинство инструментов клонирования, использующих VSS или скопированные файлы, не работают, поэтому я обнаружил следующее: http://hddguru.com/software/HDD-Raw-Copy-Tool/ который был великолепен и имеет EXE-файл с нулевой установкой, который выглядит так, как будто он предназначен для работы под WinPE, поэтому отлично работал под сервером HyperV (так что, предположительно, также и с Server Core) при запуске из командной строки.
Однако мне снова крайне необходимо было знать, какие диски были исходными и целевыми, но инструмент показывал модель диска и серийный номер, а не идентификатор diskpart, поэтому я использовал тот же трюк, вытащив физические кабели на моем (теперь известном) жестком диске и перезапустив его. инструмент HDD Guru, пока я не запишу идентификаторы для двух дисков, с которых мне нужно было копировать.
Затем я просто запустил копию, которая продолжалась даже после ошибок чтения. Я подозреваю, что мне нужно было скопировать только первые несколько секторов, но я все равно позволил ему поработать до завершения (12 часов).
5) Теперь потяните за оба кабеля SATA, извлеките неисправный диск и вставьте вновь клонированный диск на место, где он был. При повторном подключении Windows должна увидеть диск с такой же подписью в том же слоте, где, по ее мнению, находился неисправный диск.
6) Затем остается просто перестроить массив (еще 12 часов) и вернуть его в оперативный режим;
sel disk 3
online disk
sel vol 0
online vol
recover
12 часов спустя ...
sel vol 0
assign letter=e
Затем я перезагрузился, потому что это было проще, чем перезапускать все остановленные службы (а именно Hyper-v);
c:\> shutdown /r /t 0
К тому времени, как я посмотрел еще раз, со здоровым диском Hyper-V уже был запущен, и мои виртуальные машины были восстановлены. Похоже, HyperV не будет запускать виртуальные машины при отказе дисковых массивов. Похоже, у меня поврежден диск на одном из VHD, но это уже другая история.
Невероятно, что процесс восстановления RAID не немного умнее, но я заметил, что многие даже с продуктами резервного копирования Windows на протяжении многих лет от резервного копирования Windows до резервного копирования / восстановления ISA - они, кажется, делают предположение, что вы будете восстанавливать точно такое же оборудование, даже если оно неисправно, что делает резервное копирование практически бессмысленным.
А пока я снова готов и работаю - я надеюсь, что эта стенограмма поможет кому-то еще в аналогичной должности.
RAID-массив будет поставляться с собственным программным обеспечением. Большинство контроллеров позволяют запускать программное обеспечение под ядром. В противном случае вы можете запустить некоторые из них в BIOS, а некоторые - с компакт-диска. С массивом RAID вам обычно нужно ввести новый жесткий диск в качестве горячего резерва, он затем добавит его к самому RAID и повторно синхронизирует. Измененный жесткий диск теперь является новым жестким диском в отношении массива рейдов. Поступая иначе, вы можете потерять весь массив. Прочтите The Fine Manual относительно вашего RAID-контроллера.