У меня деградированный массив с 8 дисками.
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-5 REBUILDING 26% - 64K 1629.74 ON OFF
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 232.88 GB 488397168 VDB41BT4DM3Z6C
p1 OK u0 232.88 GB 488397168 VDB41BT4CMARDC
p2 DEGRADED u0 232.88 GB 488397168 VDB41DT4EGWREC
p3 OK u0 232.88 GB 488397168 VDB41BT4CHU1RC
p4 OK u0 232.88 GB 488397168 VFA100R1CGR0LB
p5 DEVICE-ERROR u0 232.88 GB 488397168 VDB41BT4CMJ5MC
p6 OK u0 232.88 GB 488397168 VDB41BT4CMARYC
p7 OK u0 232.88 GB 488397168 VDB41BT4CMJJHC
Я заменил вышедший из строя диск на p2
, и начал восстанавливать без проблем, но около 16% при восстановлении диска p5
бросает DEVICE-ERROR
что приостанавливает процесс восстановления.
Когда я пересканирую (tw_cli
/c3 rescan
), DEVICE-ERROR
исчезнет, и восстановление начнется снова. Около 26%, это DEVICE-ERROR
появляется снова, и на этот раз прерывает процесс восстановления, который начинается с 0%.
Это происходит уже неделю, и я не могу восстановить массив. Есть ли способ игнорировать это DEVICE-ERROR
просто пока массив не перестроится?
Да, вы делаете это неправильно. Вы заменяете вышедший из строя диск, затем вы перестраиваете массив. Конечно, сейчас не работает. Вы пытаетесь восстановить данные на плохой диск. Это не сработает.
Я бы также предположил, что RAID5 (в наши дни) с 8 дисками - плохая идея.
Используйте RAID6 или, по крайней мере, используйте горячий резерв. Диски не большие, поэтому вы можете обойтись без установки, которая у вас есть сейчас, но вы также ввели нетривиальный шанс, что процесс восстановления приведет к отказу другого диска (и разрушению массива).
Основываясь на вашей обновленной информации, вам, вероятно, не повезло с ремонтом этого массива.
Однако, прежде чем признать поражение, было бы неплохо просканировать диск наp5
для сбойных блоков или секторов диска, на тот случай, если ОШИБКА УСТРОЙСТВА так проста. Если это так, вы исправляете ошибку, продолжаете восстановление, а затем заменяете диск. p5
и заново отстроить.
Предполагая, что этого недостаточно, лучший подход на данном этапе - скопировать данные из массива (или восстановить из резервных копий). Некоторые из этих данных будут повреждены / потеряны, если у вас нет резервных копий - как минимум, данные, которые вы получаете DEVICE-ERROR от P5 при попытке доступа к нему, поэтому вам, возможно, придется вручную исключить эти файлы ) или каталог (ы) из процесса копирования. (Конечно, это может быть намного хуже, но в любом случае постарайтесь сделать все, что в ваших силах).
Как только данные будут в безопасности или вы избавитесь от них настолько, насколько сможете, воссоздайте массив в лучшем формате, прежде чем копировать данные обратно. В наши дни я лично не стал бы использовать ничего, кроме RAID 1/10 или 6/60, но это, в конечном счете, зависит от вас, но, надеюсь, это научило вас уроку о том, что RAID5 - не очень хорошая идея.