У меня есть программная настройка RAID 1 на CentOS 6.9 с двумя жесткими дисками (SDA и SDB). Интеллектуальное самотестирование SDB на этой неделе начало выдавать ошибки:
Device: /dev/sdb [SAT], Self-Test Log error count increased from 0 to 1
Таким образом, сегодня утром я установил его в состояние отказа с помощью mdadm, удалил SDB и вставил новый жесткий диск. Я выполнил следующие команды:
smartctl --all /dev/sdb
cat /proc/mdstat
mdadm --manage /dev/md1 --fail /dev/sdb1
mdadm --manage /dev/md1 --remove /dev/sdb1
mdadm --manage /dev/md5 --fail /dev/sdb5
mdadm --manage /dev/md5 --remove /dev/sdb5
mdadm --manage /dev/md3 --fail /dev/sdb3
mdadm --manage /dev/md3 --remove /dev/sdb3
mdadm --manage /dev/md2 --fail /dev/sdb2
mdadm --manage /dev/md2 --remove /dev/sdb2
cat /proc/mdstat
shutdown -h now
Команда top позволила мне увидеть серийный номер жестких дисков, чтобы убедиться, что я выбрал правильный диск.
После установки нового диска в BIOS сервера просто выдайте мне сообщение об ошибке (вроде) установки правильного загрузочного устройства и перезагрузите компьютер.
Я предполагаю, что (почему-то) у меня была только MBR на SDB (это только предположение). Таким образом, он не загрузится с удаленным SDB. Я попытался вернуть SDB в машину, и он просто щелкнул (конечно) и выдает ту же ошибку: установить правильное загрузочное устройство и перезапустить.
Может ли кто-нибудь сделать какие-либо предложения о том, как загрузить эту машину, чтобы я мог восстановить все свои данные? SDA все равно должен быть хорошим жестким диском. Кроме того, если есть способ загрузиться с SDA, я смогу установить новый SDB и позволить программному RAID синхронизироваться.
ОБНОВИТЬ:
Благодаря Ральфу Фридлу я загрузил сервер с LiveCD.
Я использовал:
sfdisk -d /dev/sda | sfdisk --force /dev/sdb
для разделения нового SDB точно так же, как SDA.
Спасибо!
Хорошая идея - убедиться, что оба диска могут загружаться, пока оба все еще работают. К сожалению, многие установщики делают это неправильно.
Поскольку другой ваш диск не загружается, вам понадобится рабочий или аварийный компакт-диск. Если у вас есть соответствующая инфраструктура, вы также можете загружаться по сети. После запуска вашей системы аварийного восстановления создайте таблицу разделов на новом диске, соответствующую старому, и добавьте разделы в RAID. Если у вас есть время, подождите, пока массивы синхронизируются. В противном случае начните с загрузочного раздела. Теперь сделайте привязку на dev
, proc
и sys
, выполните chroot в корневой раздел и переустановите загрузчик.
Вот что я использую для таких случаев
mount /dev/md/root /mnt
for i in /dev /proc /sys; do mount --bind $i /mnt$i; done
chroot /mnt