Назад | Перейти на главную страницу

Программный сбой RAID 1

У меня есть программная настройка RAID 1 на CentOS 6.9 с двумя жесткими дисками (SDA и SDB). Интеллектуальное самотестирование SDB на этой неделе начало выдавать ошибки:

Device: /dev/sdb [SAT], Self-Test Log error count increased from 0 to 1

Таким образом, сегодня утром я установил его в состояние отказа с помощью mdadm, удалил SDB и вставил новый жесткий диск. Я выполнил следующие команды:

smartctl --all /dev/sdb
cat /proc/mdstat 
mdadm --manage /dev/md1 --fail /dev/sdb1
mdadm --manage /dev/md1 --remove /dev/sdb1
mdadm --manage /dev/md5 --fail /dev/sdb5
mdadm --manage /dev/md5 --remove /dev/sdb5
mdadm --manage /dev/md3 --fail /dev/sdb3
mdadm --manage /dev/md3 --remove /dev/sdb3
mdadm --manage /dev/md2 --fail /dev/sdb2
mdadm --manage /dev/md2 --remove /dev/sdb2
cat /proc/mdstat 
shutdown -h now

Команда top позволила мне увидеть серийный номер жестких дисков, чтобы убедиться, что я выбрал правильный диск.

После установки нового диска в BIOS сервера просто выдайте мне сообщение об ошибке (вроде) установки правильного загрузочного устройства и перезагрузите компьютер.

Я предполагаю, что (почему-то) у меня была только MBR на SDB (это только предположение). Таким образом, он не загрузится с удаленным SDB. Я попытался вернуть SDB в машину, и он просто щелкнул (конечно) и выдает ту же ошибку: установить правильное загрузочное устройство и перезапустить.

Может ли кто-нибудь сделать какие-либо предложения о том, как загрузить эту машину, чтобы я мог восстановить все свои данные? SDA все равно должен быть хорошим жестким диском. Кроме того, если есть способ загрузиться с SDA, я смогу установить новый SDB и позволить программному RAID синхронизироваться.

ОБНОВИТЬ:

Благодаря Ральфу Фридлу я загрузил сервер с LiveCD.

Я использовал:

sfdisk -d /dev/sda | sfdisk --force /dev/sdb

для разделения нового SDB точно так же, как SDA.

Спасибо!

Хорошая идея - убедиться, что оба диска могут загружаться, пока оба все еще работают. К сожалению, многие установщики делают это неправильно.

Поскольку другой ваш диск не загружается, вам понадобится рабочий или аварийный компакт-диск. Если у вас есть соответствующая инфраструктура, вы также можете загружаться по сети. После запуска вашей системы аварийного восстановления создайте таблицу разделов на новом диске, соответствующую старому, и добавьте разделы в RAID. Если у вас есть время, подождите, пока массивы синхронизируются. В противном случае начните с загрузочного раздела. Теперь сделайте привязку на dev, proc и sys, выполните chroot в корневой раздел и переустановите загрузчик.

Вот что я использую для таких случаев

mount /dev/md/root /mnt
for i in /dev /proc /sys; do mount --bind $i /mnt$i; done
chroot /mnt