У меня есть трехдисковый массив RAID5, управляемый с помощью mdadm, с файловой системой XFS на нем. Во время использования машины я заметил, что машина внезапно перестала отвечать (новые программы не запускались и т. Д.), Но этого было достаточно, чтобы я мог открыть новый xterm и запустить dmesg. Журнал ядра показал большое количество таймаутов канала SATA. При перезагрузке машины BIOS не сообщила о двух дисках (один из дисков в массиве вместе с DVD-приводом). Проблема оказалась в приводе DVD (у меня были проблемы с ним некоторое время), и после его отключения жесткий диск снова стал видимым. Глядя с smartctl
рассматриваемый диск (/dev/sdc
) Кажется, все в порядке, поэтому я не думаю, что это сбой диска.
Проблема в том, что я не могу понять, как реактивировать свой массив. Смотрим на перегородки /dev/sda3
и /dev/sdb3
(те, которые не вышли из строя), используя mdadm --examine
показывает, что они оба, конечно, думают, что /dev/sdc3
плохой / удален, а /dev/sdc3
думает, что это нормально. Хуже того, массив активно записывался, поэтому количество событий другое, sda3 и sdb3 имеют более высокие значения. (Я был бы полностью готов выбросить эти недавно записанные данные, но я не думаю, что это актуально).
Как лучше всего вылечиться? Бег mdadm -A /dev/md2
ничего не делает, и mdadm --auto-detect
не обнаруживает массив.
$ sudo mdadm --query /dev/md2
/dev/md2: is an md device which is not active
$ sudo mdadm --query /dev/sda3
/dev/sda3: device 0 in 3 device undetected raid5 /dev/md2. Use mdadm --examine for more detail.
Однако бег mdadm --examine --scan -c none
печатает массив с правильным UUID, поэтому очевидно, что он его находит. Вот соответствующая часть /proc/mdstat
, показывая все диски как запасные:
md2 : inactive sda3[0](S) sdc3[2](S) sdb3[1](S)
811868544 blocks
Мне кажется весьма любопытным, что отказ одного диска в RAID5, по-видимому, привел к тому, что мой массив стал недоступен. :(
Что здесь лучше всего делать?
Если вы видите массив в / proc / mdstat, значит, массив собран; вам нужно его запустить:
sudo mdadm -R /dev/md2
Если он не запускается, попробуйте повторно запустить команду с -v
переключатель (подробный) и опубликуйте результат.
После его активации вы сможете проверить его статус и при необходимости повторно добавить sdc3.