У нас есть RAID 5 с RAID-контроллером 3ware 9550SX, который показывает один неисправный диск. Для массива настроен запасной диск, но он не использовался автоматически по назначению.
Текущий статус массива следующий:
> /c0 show
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-5 DEGRADED - - 64K 11175.8 OFF OFF
u1 SPARE OK - - - 1863.01 - OFF
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 1.82 TB 3907029168 WD-WMAY0108****
p1 OK u0 1.82 TB 3907029168 WD-WMAY0080****
p2 OK u0 1.82 TB 3907029168 WD-WMAY0109****
p3 OK u0 1.82 TB 3907029168 WD-WMAY0080****
p4 DEVICE-ERROR u0 1.82 TB 3907029168 WD-WMAY0108****
p5 OK u0 1.82 TB 3907029168 WD-WMAY0109****
p6 OK u0 1.82 TB 3907029168 WD-WMAY0080****
p7 OK u1 1.82 TB 3907029168 WD-WCAY0188****
Name OnlineState BBUReady Status Volt Temp Hours LastCapTest
---------------------------------------------------------------------------
bbu On Yes OK OK OK 0 xx-xxx-xxxx
> /c0/u1 show
Unit UnitType Status %RCmpl %V/I/M Port Stripe Size(GB)
------------------------------------------------------------------------
u1 SPARE OK - - p7 - 1863.01
> /c0/u0 show
Unit UnitType Status %RCmpl %V/I/M Port Stripe Size(GB)
------------------------------------------------------------------------
u0 RAID-5 DEGRADED* - - - 64K 11175.8
u0-0 DISK OK - - p6 - 1862.63
u0-1 DISK OK - - p5 - 1862.63
u0-2 DISK DEGRADED - - p4 - 1862.63
u0-3 DISK OK - - p3 - 1862.63
u0-4 DISK OK - - p2 - 1862.63
u0-5 DISK OK - - p1 - 1862.63
u0-6 DISK OK - - p0 - 1862.63
u0/v0 Volume - - - - - 11175.8
При попытке вручную запустить восстановление с помощью tw_cli
мы столкнулись со следующей ошибкой:
> /c0/u0 start rebuild disk=p7
Error: (CLI:144) Invalid drive(s) specified.
Мы попробовали еще несколько вариантов этой команды (/c0/u0 start rebuild disk=7
и maint rebuild c0 u0 p7
), но это не похоже на синтаксическую ошибку или ошибку при указании диска. По какой-то причине RAID-контроллер не хочет использовать этот конкретный диск для восстановления.
Запасной диск должен быть в том же устройстве? Или может быть проблема в том, что запчасть из другой партии? Как я могу заставить массив использовать запасные части, которые у нас есть, для восстановления массива?
Перед тем, как приступить к перестройке массива, вам необходимо настроить параметры контроллера. Эта команда включит автоматическое перестроение:
> /c0 set autorebuild=on
Удалите неисправный диск 4 из массива:
> /c0/p4 remove
Используйте следующую команду для определения неисправного диска по светодиодному индикатору:
> /c0/p4 set identify=on
Извлеките неисправный диск из сервера и бросьте его в корзину. Если перестроение массива не начнется автоматически, запустите его вручную:
> /c0/u0 start rebuild disk=7
Когда вы вставите новый диск в качестве горячего резерва, введите следующие команды:
> /c0 rescan
> /c0/p4 add type=spare