Настройка: 8 дисков в массиве RAID5, управляемом mdadm (/ dev / md0, из / dev / sdc через / dev / sdj). Один диск (/ dev / sdh) показывает ошибки SMART (увеличение количества ожидающих секторов), поэтому я ищу его замену. Кроме того, машина загружается с твердотельного накопителя Revodrive в слот PCIe, настроенный с полосой RAID0.
Странность: вывод mdadm --detail показывает, что массив чистый, и все работает нормально (я могу без проблем монтировать, читать и записывать массив). mdadm --examine вывод для каждого диска показывает состояние массива сбой.
root@saturn:/backup# cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]
md0 : active raid5 sdi1[6] sdj1[8] sdh1[5] sdg1[4] sdf1[3] sde1[2] sdd1[1] sdc1[0]
20511854272 blocks super 1.0 level 5, 64k chunk, algorithm 2 [8/8] [UUUUUUUU]
unused devices: <none>
В таблице proc отображается только управляемый mdadm массив дисков SATA, а не revodrive, чего я ожидал, поскольку RAID-массив revodrive должен управляться собственным аппаратным контроллером.
root@saturn:/backup# mdadm --detail /dev/md0
mdadm: metadata format 01.00 unknown, ignored.
/dev/md0:
Version : 01.00
Creation Time : Wed Apr 20 10:14:05 2011
Raid Level : raid5
Array Size : 20511854272 (19561.63 GiB 21004.14 GB)
Used Dev Size : 5860529792 (5589.04 GiB 6001.18 GB)
Raid Devices : 8
Total Devices : 8
Preferred Minor : 0
Persistence : Superblock is persistent
Update Time : Mon Sep 19 13:42:21 2011
State : clean
Active Devices : 8
Working Devices : 8
Failed Devices : 0
Spare Devices : 0
Layout : left-symmetric
Chunk Size : 64K
Name : saturn:0 (local to host saturn)
UUID : e535a44b:b319927e:4a574c20:39fc3f08
Events : 45
Number Major Minor RaidDevice State
0 8 33 0 active sync /dev/sdc1
1 8 49 1 active sync /dev/sdd1
2 8 65 2 active sync /dev/sde1
3 8 81 3 active sync /dev/sdf1
4 8 97 4 active sync /dev/sdg1
5 8 113 5 active sync /dev/sdh1
6 8 129 6 active sync /dev/sdi1
8 8 145 7 active sync /dev/sdj1
Очевидно, что в первой строке есть ошибка формата метаданных из автоматически созданного флага метаданных в mdadm.conf, но это mdadm v2.6.7.1, работающий на Ubuntu, и я списал это на известная проблема
root@saturn:/backup# mdadm --examine /dev/sdc1
mdadm: metadata format 01.00 unknown, ignored.
/dev/sdc1:
Magic : a92b4efc
Version : 1.0
Feature Map : 0x0
Array UUID : e535a44b:b319927e:4a574c20:39fc3f08
Name : saturn:0 (local to host saturn)
Creation Time : Wed Apr 20 10:14:05 2011
Raid Level : raid5
Raid Devices : 8
Avail Dev Size : 5860529904 (2794.52 GiB 3000.59 GB)
Array Size : 41023708544 (19561.63 GiB 21004.14 GB)
Used Dev Size : 5860529792 (2794.52 GiB 3000.59 GB)
Super Offset : 5860530160 sectors
State : clean
Device UUID : 1b508410:b129e871:d92c7979:30764611
Update Time : Mon Sep 19 13:52:58 2011
Checksum : 2e68592 - correct
Events : 45
Layout : left-symmetric
Chunk Size : 64K
Array Slot : 0 (0, 1, 2, 3, 4, 5, 6, failed, 7)
Array State : Uuuuuuuu 1 failed
Но в выходных данных --examine состояние массива - сбой. Кажется, что каждый диск показывает себя как отказавший член - / dev / sdd показывает uUuuuuuu, / dev / sde показывает uuUuuuuu и т. д. - но все они показывают загадочный 9-й «неудачный» слот между слотами 6 и 7 в предыдущей строке.
Я предполагаю, что дисковые суперблоки хреновые, несмотря на то, что все работает. Я хотел бы исправить это, прежде чем приступить к замене подозрительного диска, так как меня немного беспокоит, как диски могут вести себя, если я выйду из строя. Как мне лучше всего продолжить?
Вам необходимо обновить mdadm как минимум до версии v3.1.1. Эта ошибка описывает возникшую у вас проблему и то, как обновление mdadm показывает, что новый формат суперблока теперь интерпретируется правильно.
Точно такая же идея, как у вас и Эндрю: похоже, проблема с md-superblock (s).
Так что выполните команду fail / remove / zero-superblock / add на диске (ах), который содержит суперблок (ы).