Назад | Перейти на главную страницу

Как исправить LSI MegaRaid RAID5 после сбоя 1 диска

Мой LSI MegaRaid только что сказал мне, что один диск называется «UBad», что, как я полагаю, означает, что он вышел из строя:

EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                Sp Type 
--------------------------------------------------------------------------------
252:7    13 UBad   F 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -

У меня установлен горячий резерв:

EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                Sp Type 
--------------------------------------------------------------------------------
252:6    14 DHS    0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 D -

но статус горячего резерва не изменился. Используется ли он для сохранения моего RAID-массива?

Если нет, как мне сказать контроллеру добавить горячий резерв в группу дисков 0?

Во-первых, получите некоторую информацию о вашем контроллере, томах и диске:

storcli /c0 show all

/c0 контроллер, который нужно проверить. Если не уверены, попробуйте /cALL и найдите строку вроде Controller = чтобы получить номера контроллеров.

Нам нужны EID и Slot / Slt из вывода. В TOPOLOGY или PD LIST являются хорошим:

TOPOLOGY :
========

---------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type  State BT     Size PDC  PI SED DS3  FSpace TR 
---------------------------------------------------------------------------
 0 -   -   -        -   RAID5 Optl  Y  8.185 TB dflt N  N   none N      N  
 0 0   -   -        -   RAID5 Optl  Y  8.185 TB dflt N  N   none N      N  
 0 0   0   252:0    10  DRIVE Onln  N  2.728 TB dflt N  N   none -      N  
 0 0   1   252:1    9   DRIVE Onln  N  2.728 TB dflt N  N   none -      N  
 0 0   2   252:2    11  DRIVE Onln  N  2.728 TB dflt N  N   none -      N  
 0 0   3   252:3    8   DRIVE Onln  N  2.728 TB dflt N  N   none -      N  
 0 -   -   252:7    13  DRIVE DHS   -  2.728 TB -    -  -   -    -      N  
 0 -   -   252:6    14  DRIVE DHS   -  2.728 TB -    -  -   -    -      N  
---------------------------------------------------------------------------
...
PD LIST :
=======
--------------------------------------------------------------------------------
EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                Sp Type 
--------------------------------------------------------------------------------
252:0    10 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68AX9N0 U  -    
252:1     9 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68AX9N0 U  -    
252:2    11 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -    
252:3     8 Onln   0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -    
252:4    12 Onln   - 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -    
252:6    14 DHS    0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -    
252:7    13 DHS    0 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -    
--------------------------------------------------------------------------------

Для того, чтобы контроллер пересматривал привод, установите его на good:

storcli /c0 /e252 /s14 set good

/e252 это корпус (EID на выходе) и /s14 это слот (Slt на выходе).

Состояние диска теперь должно быть uGood:

EID:Slt DID State DG     Size Intf Med SED PI SeSz Model                Sp Type 
--------------------------------------------------------------------------------
252:7    13 uGood  F 2.728 TB SATA HDD N   N  512B WDC WD30EFRX-68EUZN0 U  -

Если контроллер уже знал диск (он был установлен раньше, но по какой-то причине контроллер решил, что диск неисправен), это может отображаться как DHS (выделенный горячий резерв).

Чтобы убедиться, что с диском все в порядке, запустите самотестирование:

smartctl -d megaraid,14  /dev/sdb -t long

14 это DID (Идентификатор диска) из PD LIST (storcli /c0 show all). Это тот диск, который вам нужен. /dev/sdb - это устройство Linux, подключенное к драйверу мегарада. -t long запускает длительный самотестирование.

Чтобы найти устройство Linux, используйте lsscsi:

 [6:2:0:0]    disk    LSI      MR9260-8i        2.13  /dev/sdb

Чтобы проверить состояние самотестирования, используйте smartctl -d megaraid,14 /dev/sdb -c или smartctl -d megaraid,14 /dev/sdb -a