Мой LSI MegaRaid только что сказал мне, что один диск называется «UBad», что, как я полагаю, означает, что он вышел из строя:
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp Type
--------------------------------------------------------------------------------
252:7 13 UBad F 2.728 TB SATA HDD N N 512B WDC WD30EFRX-68EUZN0 U -
У меня установлен горячий резерв:
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp Type
--------------------------------------------------------------------------------
252:6 14 DHS 0 2.728 TB SATA HDD N N 512B WDC WD30EFRX-68EUZN0 D -
но статус горячего резерва не изменился. Используется ли он для сохранения моего RAID-массива?
Если нет, как мне сказать контроллеру добавить горячий резерв в группу дисков 0?
Во-первых, получите некоторую информацию о вашем контроллере, томах и диске:
storcli /c0 show all
/c0
контроллер, который нужно проверить. Если не уверены, попробуйте /cALL
и найдите строку вроде Controller =
чтобы получить номера контроллеров.
Нам нужны EID и Slot / Slt из вывода. В TOPOLOGY
или PD LIST
являются хорошим:
TOPOLOGY :
========
---------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type State BT Size PDC PI SED DS3 FSpace TR
---------------------------------------------------------------------------
0 - - - - RAID5 Optl Y 8.185 TB dflt N N none N N
0 0 - - - RAID5 Optl Y 8.185 TB dflt N N none N N
0 0 0 252:0 10 DRIVE Onln N 2.728 TB dflt N N none - N
0 0 1 252:1 9 DRIVE Onln N 2.728 TB dflt N N none - N
0 0 2 252:2 11 DRIVE Onln N 2.728 TB dflt N N none - N
0 0 3 252:3 8 DRIVE Onln N 2.728 TB dflt N N none - N
0 - - 252:7 13 DRIVE DHS - 2.728 TB - - - - - N
0 - - 252:6 14 DRIVE DHS - 2.728 TB - - - - - N
---------------------------------------------------------------------------
...
PD LIST :
=======
--------------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp Type
--------------------------------------------------------------------------------
252:0 10 Onln 0 2.728 TB SATA HDD N N 512B WDC WD30EFRX-68AX9N0 U -
252:1 9 Onln 0 2.728 TB SATA HDD N N 512B WDC WD30EFRX-68AX9N0 U -
252:2 11 Onln 0 2.728 TB SATA HDD N N 512B WDC WD30EFRX-68EUZN0 U -
252:3 8 Onln 0 2.728 TB SATA HDD N N 512B WDC WD30EFRX-68EUZN0 U -
252:4 12 Onln - 2.728 TB SATA HDD N N 512B WDC WD30EFRX-68EUZN0 U -
252:6 14 DHS 0 2.728 TB SATA HDD N N 512B WDC WD30EFRX-68EUZN0 U -
252:7 13 DHS 0 2.728 TB SATA HDD N N 512B WDC WD30EFRX-68EUZN0 U -
--------------------------------------------------------------------------------
Для того, чтобы контроллер пересматривал привод, установите его на good
:
storcli /c0 /e252 /s14 set good
/e252
это корпус (EID
на выходе) и /s14
это слот (Slt
на выходе).
Состояние диска теперь должно быть uGood
:
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp Type
--------------------------------------------------------------------------------
252:7 13 uGood F 2.728 TB SATA HDD N N 512B WDC WD30EFRX-68EUZN0 U -
Если контроллер уже знал диск (он был установлен раньше, но по какой-то причине контроллер решил, что диск неисправен), это может отображаться как DHS
(выделенный горячий резерв).
Чтобы убедиться, что с диском все в порядке, запустите самотестирование:
smartctl -d megaraid,14 /dev/sdb -t long
14
это DID
(Идентификатор диска) из PD LIST
(storcli /c0 show all
). Это тот диск, который вам нужен. /dev/sdb
- это устройство Linux, подключенное к драйверу мегарада. -t long
запускает длительный самотестирование.
Чтобы найти устройство Linux, используйте lsscsi
:
[6:2:0:0] disk LSI MR9260-8i 2.13 /dev/sdb
Чтобы проверить состояние самотестирования, используйте smartctl -d megaraid,14 /dev/sdb -c
или smartctl -d megaraid,14 /dev/sdb -a