Назад | Перейти на главную страницу

Проблема с восстановлением raid5 с контроллером 3ware

У меня деградированный массив с 8 дисками.

Unit  UnitType  Status         %RCmpl  %V/I/M  Stripe  Size(GB)  Cache  AVrfy
------------------------------------------------------------------------------
u0    RAID-5    REBUILDING     26%     -       64K     1629.74   ON     OFF

Port   Status           Unit   Size        Blocks        Serial
---------------------------------------------------------------
p0     OK               u0     232.88 GB   488397168     VDB41BT4DM3Z6C
p1     OK               u0     232.88 GB   488397168     VDB41BT4CMARDC
p2     DEGRADED         u0     232.88 GB   488397168     VDB41DT4EGWREC
p3     OK               u0     232.88 GB   488397168     VDB41BT4CHU1RC
p4     OK               u0     232.88 GB   488397168     VFA100R1CGR0LB
p5     DEVICE-ERROR     u0     232.88 GB   488397168     VDB41BT4CMJ5MC
p6     OK               u0     232.88 GB   488397168     VDB41BT4CMARYC
p7     OK               u0     232.88 GB   488397168     VDB41BT4CMJJHC

Я заменил вышедший из строя диск на p2, и начал восстанавливать без проблем, но около 16% при восстановлении диска p5 бросает DEVICE-ERROR что приостанавливает процесс восстановления.

Когда я пересканирую (tw_cli /c3 rescan), DEVICE-ERROR исчезнет, ​​и восстановление начнется снова. Около 26%, это DEVICE-ERROR появляется снова, и на этот раз прерывает процесс восстановления, который начинается с 0%.

Это происходит уже неделю, и я не могу восстановить массив. Есть ли способ игнорировать это DEVICE-ERROR просто пока массив не перестроится?

Да, вы делаете это неправильно. Вы заменяете вышедший из строя диск, затем вы перестраиваете массив. Конечно, сейчас не работает. Вы пытаетесь восстановить данные на плохой диск. Это не сработает.

Я бы также предположил, что RAID5 (в наши дни) с 8 дисками - плохая идея.

Используйте RAID6 или, по крайней мере, используйте горячий резерв. Диски не большие, поэтому вы можете обойтись без установки, которая у вас есть сейчас, но вы также ввели нетривиальный шанс, что процесс восстановления приведет к отказу другого диска (и разрушению массива).


Основываясь на вашей обновленной информации, вам, вероятно, не повезло с ремонтом этого массива.

Однако, прежде чем признать поражение, было бы неплохо просканировать диск наp5 для сбойных блоков или секторов диска, на тот случай, если ОШИБКА УСТРОЙСТВА так проста. Если это так, вы исправляете ошибку, продолжаете восстановление, а затем заменяете диск. p5 и заново отстроить.

Предполагая, что этого недостаточно, лучший подход на данном этапе - скопировать данные из массива (или восстановить из резервных копий). Некоторые из этих данных будут повреждены / потеряны, если у вас нет резервных копий - как минимум, данные, которые вы получаете DEVICE-ERROR от P5 при попытке доступа к нему, поэтому вам, возможно, придется вручную исключить эти файлы ) или каталог (ы) из процесса копирования. (Конечно, это может быть намного хуже, но в любом случае постарайтесь сделать все, что в ваших силах).

Как только данные будут в безопасности или вы избавитесь от них настолько, насколько сможете, воссоздайте массив в лучшем формате, прежде чем копировать данные обратно. В наши дни я лично не стал бы использовать ничего, кроме RAID 1/10 или 6/60, но это, в конечном счете, зависит от вас, но, надеюсь, это научило вас уроку о том, что RAID5 - не очень хорошая идея.