Назад | Перейти на главную страницу

Как удалить неисправный диск из группы дисков LSI MegaRAID?

Один из дисков в группе 0 (EID: Slot 252: 4, DiskID 12) начинает давать сбой в своих интеллектуальных тестах:

  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       1837
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       57

но я не могу найти документации, как удалять диски из дисковой группы.

Должен ли я

storcli /c0/e252/s4 set offline

или скорее

storcli /c0/e252/s4 spindown

или оба? В чем разница между "spindown" и "offline"? Что о

storcli /c0/s4 set missing

Что это значит? Что значит «отсутствует»?

А как насчет ребилда? Это запускается автоматически?

Если нет, то я думаю, что команда "начать восстановление" - мой друг, но почему я должен указывать для этого один диск? Было бы гораздо разумнее указать группу дисков или том для восстановления, не так ли?

В соответствии с https://www.45drives.com/wiki/index.php?title=How_do_I_replace_a_failed_drive_with_LSI_9280_cards%3F, правильная последовательность:

storcli /c0/e252/s4 set offline
storcli /c0/e252/s4 set missing
storcli /c0/eall/s4 spindown     // Note: /eall instead of /e252. No idea why.

После первой команды вывод storcli /c0/e252/s4 должен показать Offln. После последней команды это было UGood (Ненастроенное хорошее) для меня.

Обратите внимание, что вторая команда (set missing) не удалось для меня.

После этого восстановление должно начаться, если у вас есть выделенный или глобальный «горячий» резерв (DHS или GHS) и включено автоматическое восстановление. Чтобы убедиться в этом, запустите

storcli /c0/eall/sall show rebuild

Это напечатает что-то вроде этого:

Controller = 0
Status = Success
Description = Show Drive Rebuild Status Succeeded.


----------------------------------------------------------
Drive-ID    Progress% Status          Estimated Time Left 
----------------------------------------------------------
/c0/e252/s0 -         Not in progress -                   
/c0/e252/s1 -         Not in progress -                   
/c0/e252/s2 -         Not in progress -                   
/c0/e252/s3 -         Not in progress -                   
/c0/e252/s4 -         Not in progress -                   
/c0/e252/s6 18        In progress     -                   
/c0/e252/s7 -         Not in progress -                   
----------------------------------------------------------

Обратите внимание на значение «В процессе» для слота 6 (s6). Во втором столбце указан процент восстановления (18%).

Я использую этот небольшой скрипт для отслеживания прогресса:

while true ; do clear ; date ; storcli /c0/e252/s6 show rebuild ; sleep 5 ; done

Чтобы найти неисправный диск, вы можете использовать эту команду:

storcli /c0/e252/s4 start locate

Это должно заставить мигать индикатор вашего накопителя.