Назад | Перейти на главную страницу

Сбой рабочего диска - К счастью, сегодня воскресенье и нерабочее время (mdadm raid 5)

У меня есть производственный рейдовый массив, в котором возникли проблемы. К счастью, когда я настроил его, я назначил горячий резерв. Вот как выглядит статус сейчас:

mdadm --detail /dev/md2
/dev/md2:
        Version : 0.90
  Creation Time : Sun Jul  4 14:49:33 2010
     Raid Level : raid5
     Array Size : 3907039744 (3726.04 GiB 4000.81 GB)
  Used Dev Size : 976759936 (931.51 GiB 1000.20 GB)
   Raid Devices : 5
  Total Devices : 6
Preferred Minor : 2
    Persistence : Superblock is persistent

    Update Time : Sun Aug  5 11:56:50 2012
          State : active, degraded, recovering
 Active Devices : 4
Working Devices : 5
 Failed Devices : 1
  Spare Devices : 1

         Layout : left-symmetric
     Chunk Size : 64K

 Rebuild Status : 63% complete

           UUID : dce41d37:804dea59:e5727503:733c194b
         Events : 0.13139

    Number   Major   Minor   RaidDevice State
       0       8      145        0      active sync   /dev/sdj1
       1       8      161        1      active sync   /dev/sdk1
       2       8      177        2      active sync   /dev/sdl1
       3       8      193        3      active sync   /dev/sdm1
       5       8      225        4      spare rebuilding   /dev/sdo1

       6       8      209        -      faulty spare   /dev/sdn1

Однако если и когда это завершится, что мне нужно сделать, чтобы заменить неисправный диск на новый запасной? В идеале я не хочу отключать систему на следующей неделе.

Если ваша система поддерживает горячую замену (sata, sas, ...), вы можете:

mdadm /dev/md2 --remove /dev/sdn1

Чтобы удалить диск из рейд-массива md2. Позже, когда вы подключите новый диск и разбили его на разделы, вы можете:

mdadm /dev/md2 --add /dev/sdx1 

Чтобы добавить его в рейд.

Нужно ли вам отключать сервер, зависит исключительно от ОС и оборудования. host-swap функции. Если hot-swap поддерживается во всем стеке, должна быть возможность извлечь диск при работающем сервере.

С другой стороны, hot spare в массиве рейдов просто дало вам время запланировать запланированное время простоя, если это необходимо.