Назад | Перейти на главную страницу

Нечетный вывод mdadm: --examine показывает сбой состояния массива, --detail показывает, что все чисто

Настройка: 8 дисков в массиве RAID5, управляемом mdadm (/ dev / md0, из / dev / sdc через / dev / sdj). Один диск (/ dev / sdh) показывает ошибки SMART (увеличение количества ожидающих секторов), поэтому я ищу его замену. Кроме того, машина загружается с твердотельного накопителя Revodrive в слот PCIe, настроенный с полосой RAID0.

Странность: вывод mdadm --detail показывает, что массив чистый, и все работает нормально (я могу без проблем монтировать, читать и записывать массив). mdadm --examine вывод для каждого диска показывает состояние массива сбой.

root@saturn:/backup# cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
md0 : active raid5 sdi1[6] sdj1[8] sdh1[5] sdg1[4] sdf1[3] sde1[2] sdd1[1] sdc1[0]
      20511854272 blocks super 1.0 level 5, 64k chunk, algorithm 2 [8/8] [UUUUUUUU]

unused devices: <none>

В таблице proc отображается только управляемый mdadm массив дисков SATA, а не revodrive, чего я ожидал, поскольку RAID-массив revodrive должен управляться собственным аппаратным контроллером.

root@saturn:/backup# mdadm --detail /dev/md0
mdadm: metadata format 01.00 unknown, ignored.
/dev/md0:
        Version : 01.00
  Creation Time : Wed Apr 20 10:14:05 2011
     Raid Level : raid5
     Array Size : 20511854272 (19561.63 GiB 21004.14 GB)
  Used Dev Size : 5860529792 (5589.04 GiB 6001.18 GB)
   Raid Devices : 8
  Total Devices : 8
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Mon Sep 19 13:42:21 2011
          State : clean
 Active Devices : 8
Working Devices : 8
 Failed Devices : 0
  Spare Devices : 0

         Layout : left-symmetric
     Chunk Size : 64K

           Name : saturn:0  (local to host saturn)
           UUID : e535a44b:b319927e:4a574c20:39fc3f08
         Events : 45

    Number   Major   Minor   RaidDevice State
       0       8       33        0      active sync   /dev/sdc1
       1       8       49        1      active sync   /dev/sdd1
       2       8       65        2      active sync   /dev/sde1
       3       8       81        3      active sync   /dev/sdf1
       4       8       97        4      active sync   /dev/sdg1
       5       8      113        5      active sync   /dev/sdh1
       6       8      129        6      active sync   /dev/sdi1
       8       8      145        7      active sync   /dev/sdj1

Очевидно, что в первой строке есть ошибка формата метаданных из автоматически созданного флага метаданных в mdadm.conf, но это mdadm v2.6.7.1, работающий на Ubuntu, и я списал это на известная проблема

root@saturn:/backup# mdadm --examine /dev/sdc1
mdadm: metadata format 01.00 unknown, ignored.
/dev/sdc1:
          Magic : a92b4efc
        Version : 1.0
    Feature Map : 0x0
     Array UUID : e535a44b:b319927e:4a574c20:39fc3f08
           Name : saturn:0  (local to host saturn)
  Creation Time : Wed Apr 20 10:14:05 2011
     Raid Level : raid5
   Raid Devices : 8

 Avail Dev Size : 5860529904 (2794.52 GiB 3000.59 GB)
     Array Size : 41023708544 (19561.63 GiB 21004.14 GB)
  Used Dev Size : 5860529792 (2794.52 GiB 3000.59 GB)
   Super Offset : 5860530160 sectors
          State : clean
    Device UUID : 1b508410:b129e871:d92c7979:30764611

    Update Time : Mon Sep 19 13:52:58 2011
       Checksum : 2e68592 - correct
         Events : 45

         Layout : left-symmetric
     Chunk Size : 64K

    Array Slot : 0 (0, 1, 2, 3, 4, 5, 6, failed, 7)
   Array State : Uuuuuuuu 1 failed

Но в выходных данных --examine состояние массива - сбой. Кажется, что каждый диск показывает себя как отказавший член - / dev / sdd показывает uUuuuuuu, / dev / sde показывает uuUuuuuu и т. д. - но все они показывают загадочный 9-й «неудачный» слот между слотами 6 и 7 в предыдущей строке.

Я предполагаю, что дисковые суперблоки хреновые, несмотря на то, что все работает. Я хотел бы исправить это, прежде чем приступить к замене подозрительного диска, так как меня немного беспокоит, как диски могут вести себя, если я выйду из строя. Как мне лучше всего продолжить?

Вам необходимо обновить mdadm как минимум до версии v3.1.1. Эта ошибка описывает возникшую у вас проблему и то, как обновление mdadm показывает, что новый формат суперблока теперь интерпретируется правильно.

Точно такая же идея, как у вас и Эндрю: похоже, проблема с md-superblock (s).

Так что выполните команду fail / remove / zero-superblock / add на диске (ах), который содержит суперблок (ы).