Назад | Перейти на главную страницу

Восстановление из командной строки RAID5, установленного на Server 2008 HyperV (или Core)

У меня есть блок HyperV, который показывает плохие блоки на одном из дисков. Я получил это с diskpart;

DISKPART> list disk

  Disk ###  Status         Size     Free     Dyn  Gpt
  --------  -------------  -------  -------  ---  ---
  Disk 0    Online          148 GB  4096 MB
  Disk 1    Online         1863 GB      0 B   *
  Disk 2    Online         1863 GB      0 B   *
  Disk 3    Errors         1863 GB      0 B   *

Я набрал;

sel disk 3
offline disk
online disk

А теперь он отображается просто как онлайн. Этого достаточно? Предположительно, это может обойти один или два плохих блока. Есть ли способ переформатировать сбой и повторно синхронизировать его с массивом из командной строки. Придется ли мне его немедленно заменить?

Обновление - после ремонта по-прежнему отображается "Failed Rd"

Итак, используя запасной кабель, я подключил новый дополнительный жесткий диск. По-видимому, я должен оставить существующий модуль на месте, поскольку он не может восстановить массив с отсутствующим диском (я не знаю, почему - это, казалось бы, было сутью). Затем я сделал следующее, чтобы инициализировать его;

sel disk 4
convert dynamic

затем восстановить массив;

sel vol 0
repair disk=4

Насколько я понимаю, это предполагается использовать новый диск 4 восстановить массив без неисправного диска 3. И, как и ожидалось, я понял это;

  DISKPART> list vol

  Volume ###  Ltr  Label        Fs     Type        Size     Status     Info
  ----------  ---  -----------  -----  ----------  -------  ---------  --------
* Volume 0     E   E_RAID5_4TB  NTFS   RAID-5      3726 GB  Rebuild
  Volume 1     C   C_BOOT(MIR)  NTFS   Partition     39 GB  Healthy    System
  Volume 2     D   D_DATA(MIR)  NTFS   Partition     52 GB  Healthy
  Volume 3     G   G_IMAGES(MI  NTFS   Partition     52 GB  Healthy    Boot

Однако примерно через 12-24 часа массив вернулся к Failed Rd и 1863 свободного места на новом диске. Я пробовал уже дважды с теми же результатами. Я сейчас пробую попроще recover команда, но я ожидаю того же результата.

В течение последнего десятилетия или около того, это был мой опыт работы с RAID. Для персональных серверов, где частота отказов дисков относительно невелика (примерно каждые 2–3 года в среднем), я определенно придерживаюсь мнения, что Windows RAID менее проблематичен, чем любой аппаратный контроллер, который всегда кажется устаревшим к тому времени, когда я нужно использовать для восстановления. Однако я не думаю, что мне когда-либо удавалось легко восстановить RAID-массив с помощью аппаратного ИЛИ программного обеспечения и осуществить мечту так, как было обещано.

Когда (как я ожидал) recover команда не может восстановить диск, я попытаюсь физически установить новый жесткий диск вместо вышедшего из строя диска и попытаться таким образом подключить его к сети. Я смутно припоминаю, что делал нечто подобное в прошлый раз.

Я был бы признателен за дальнейшие советы в этой ситуации, даже если они напоминают мне шаги по замене физического диска.

Как всегда, по моему опыту, процесс восстановления не работает в том виде, в каком он задокументирован.

Я решил это, клонировав неисправный диск на новый, а затем физически подключив его вместо вышедшего из строя. Затем я выпустил diskpart recover команда (которая, как мне кажется, является сокращением для repair.

Мне удалось сделать это без загрузочных компакт-дисков восстановления ISO и внешнего оборудования следующим образом;

1) Вставьте новый диск (используя запасной порт). И обратите внимание на идентификатор диска. Убедитесь, что он не в сети.

2) Полностью отключите том RAID; sel vol 0

REM Remove drive letter association - you may need to shut...
REM ...down any services using this
remove

offline vol

3) Найдите физический диск, на котором произошел сбой. detail vol подскажет, какие диски в томе, list vol покажет, какой идентификатор диска содержит ошибки. Все мои диски идентичны модели, поэтому я физически вытащил кабель SATA, подождал несколько секунд и выпустил list disk еще раз, чтобы увидеть, какой идентификатор диска отсутствует. И принял это к сведению. Тогда в моем случае;

sel disk 3
offline disk

4) Чтобы клонировать диск в достаточной степени, чтобы окна можно было обмануть, думая, что новый диск был просто отремонтированным старым диском, я подозревал, что он должен иметь такую ​​же подпись диска, поэтому мне нужна была копия сектора низкого уровня.

Большинство инструментов клонирования, использующих VSS или скопированные файлы, не работают, поэтому я обнаружил следующее: http://hddguru.com/software/HDD-Raw-Copy-Tool/ который был великолепен и имеет EXE-файл с нулевой установкой, который выглядит так, как будто он предназначен для работы под WinPE, поэтому отлично работал под сервером HyperV (так что, предположительно, также и с Server Core) при запуске из командной строки.

Однако мне снова крайне необходимо было знать, какие диски были исходными и целевыми, но инструмент показывал модель диска и серийный номер, а не идентификатор diskpart, поэтому я использовал тот же трюк, вытащив физические кабели на моем (теперь известном) жестком диске и перезапустив его. инструмент HDD Guru, пока я не запишу идентификаторы для двух дисков, с которых мне нужно было копировать.

Затем я просто запустил копию, которая продолжалась даже после ошибок чтения. Я подозреваю, что мне нужно было скопировать только первые несколько секторов, но я все равно позволил ему поработать до завершения (12 часов).

5) Теперь потяните за оба кабеля SATA, извлеките неисправный диск и вставьте вновь клонированный диск на место, где он был. При повторном подключении Windows должна увидеть диск с такой же подписью в том же слоте, где, по ее мнению, находился неисправный диск.

6) Затем остается просто перестроить массив (еще 12 часов) и вернуть его в оперативный режим;

sel disk 3
online disk
sel vol 0
online vol
recover

12 часов спустя ...

sel vol 0
assign letter=e

Затем я перезагрузился, потому что это было проще, чем перезапускать все остановленные службы (а именно Hyper-v);

c:\> shutdown /r /t 0

К тому времени, как я посмотрел еще раз, со здоровым диском Hyper-V уже был запущен, и мои виртуальные машины были восстановлены. Похоже, HyperV не будет запускать виртуальные машины при отказе дисковых массивов. Похоже, у меня поврежден диск на одном из VHD, но это уже другая история.

Невероятно, что процесс восстановления RAID не немного умнее, но я заметил, что многие даже с продуктами резервного копирования Windows на протяжении многих лет от резервного копирования Windows до резервного копирования / восстановления ISA - они, кажется, делают предположение, что вы будете восстанавливать точно такое же оборудование, даже если оно неисправно, что делает резервное копирование практически бессмысленным.

А пока я снова готов и работаю - я надеюсь, что эта стенограмма поможет кому-то еще в аналогичной должности.

RAID-массив будет поставляться с собственным программным обеспечением. Большинство контроллеров позволяют запускать программное обеспечение под ядром. В противном случае вы можете запустить некоторые из них в BIOS, а некоторые - с компакт-диска. С массивом RAID вам обычно нужно ввести новый жесткий диск в качестве горячего резерва, он затем добавит его к самому RAID и повторно синхронизирует. Измененный жесткий диск теперь является новым жестким диском в отношении массива рейдов. Поступая иначе, вы можете потерять весь массив. Прочтите The Fine Manual относительно вашего RAID-контроллера.