Назад | Перейти на главную страницу

Диск отказал во время восстановления 3ware RAID 5

У меня есть RAID-контроллер 3ware 9650SE с массивом RAID 5, содержащим 15 дисков Seagate ST31000340NS. Заметив ошибки ECC на диске Port 10, я заменил его запасным и начал восстановление RAID. Во время перестройки диск порта 5 полностью вышел из строя, в результате чего массив стал неработоспособным, поскольку новый диск в порту 10 был неполным. Массив оставался в использовании во время восстановления до выхода из строя диска порта 5. Я надеялся восстановить данные, вернув исходный диск с портом 10, но RAID-контроллер не добавил их обратно в массив. Вместо этого он был указан как «доступный». У меня вопрос: как заставить контроллер распознавать исходный диск с портом 10 в его исходном местоположении? В интерфейсе 3dm2 нет опции «добавить диск».

* ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ * Спасибо за все комментарии и предложения, относящиеся к моей исходной публикации. Я должен был упомянуть ранее, что массив был смонтирован только для чтения во время перестройки. Я не знаю, имеет ли это какое-либо значение для шансов заставить контроллер принять исходный диск обратно. Кстати, резервной копии нет. Что бы ни случилось, я, безусловно, усвоил урок. RAID5.

Я считаю, что тебе не повезло. Это одна из опасностей RAID5. Поскольку массив использовался, все остальные диски теперь не синхронизированы с исходным диском с портом 10.

обновлено: Что касается монтажа обновления только для чтения ... Работает ли это на самом деле, будет деталью реализации 3ware. Даже если вы смонтировали только для чтения, рейд-контроллер мог обновить некоторые метаданные на дисках и решить, что эта конфигурация не подлежит восстановлению. Вот чего я ожидал.

Лучший вариант - восстановить из резервной копии. Поскольку массив использовался, данные на диске 10 не синхронизировались.

RAID 5 больше не рекомендуется использовать по мере увеличения размеров дисков; шансы неисправимой ошибки на дисках возрастают и обычно не обнаруживаются до тех пор, пока не произойдет сбой диска в массиве RAID 5 (когда обнаруживается второй диск и его скрытое плохое место).

Вам может повезти, если ошибка на втором диске связана с той частью диска, которая не используется файловой системой. Поэтому, если у вас нет резервных копий, вы можете попробовать перестроить с установленным флагом «игнорировать ошибки ECC при перестроении». Затем вы захотите запустить какую-либо форму проверки целостности вашей файловой системы, и вам, возможно, придется ожидать некоторого повреждения данных в худшем случае. Тем не менее, может быть предпочтительнее потерять всю громкость.

Если ваш массив оставался в сети и получал записи после того, как вы удалили неисправный диск на порт 10, это означает, что диск несовместим с остальной частью массива, и даже если вы могли бы принудительно подключить его, любые тома в массиве были бы повреждены.

Не спрашивайте меня, откуда я это знаю ...

Восстановление из резервных копий, вероятно, ваш единственный возможный вариант.

При сегодняшних размерах дисков вероятность отказа другого диска, когда один из дисков уже вышел из строя, составляет 62%, когда потребительские диски: http://talkback.zdnet.com/5208-12694-0.html?forumID=1&threadID=36299&messageID=1008171

Никогда не используйте raid 5. Если вам необходимо обеспечить высокую доступность и дешевое хранилище, выберите raid6 и горячее резервирование.