Назад | Перейти на главную страницу

Восстановление массива RAID 10 с двумя вышедшими из строя дисками

У меня есть выделенный сервер с 4 жесткими дисками в аппаратной конфигурации RAID 10, и он отлично работал до вчерашнего дня, когда он начал случайным образом вылетать через пару минут. Я связался со своим центром обработки данных, и они провели диагностику системы, и они обнаружили, что один из моих жестких дисков в массиве RAID 10 был неисправен, они заменили диск, и он начал автоматически восстанавливаться. Затем они загрузили систему в обычном режиме, и она проработала нормально 15 минут, когда снова начала давать сбой. Я сделал несколько диагностик самостоятельно, и когда я проверил состояние физических дисков с помощью:

arcconf GETCONFIG 1 PD

Я заметил, что на жестком диске 0,0 есть SMART-ошибки, я сообщил об этом своему DC, и они подтвердили это и попросили заменить это устройство новым, но они предложили мне сделать резервную копию моих данных (~ 2 ТБ), потому что это очень вероятно потеряю свои данные. Я сделал резервную копию своих данных, а затем они заменили второй жесткий диск. После загрузки необходимо было произвести принудительный запуск RAID-контроллера, и система загрузилась в режиме восстановления. Я думаю, что они заменили не тот диск в первый раз, потому что очень маловероятно, что два диска одновременно выйдут из строя в разных наборах зеркал, но это уже другая история ... Моя проблема в том, что второй замененный жесткий диск не восстанавливает сам себя. Я попытался очистить метаданные для этого диска с помощью:

arcconf TASK START 1 DEVICE 0 0 CLEAR

и затем установите состояние диска как горячий резерв с помощью

arcconf SETSTATE 1 DEVICE 0 0 HSP LOGICALDRIVE 0

чтобы он начал процесс восстановления автоматически, но безуспешно.

Данные моего массива RAID 10 - это 4 жестких диска HDD 0,0 и HDD 0,1 в зеркальном наборе, а HDD 0,2 и HDD 0,3 в другом.

Выход из состояния логического устройства: arcconf getconfig 1 ld

https://dl.dropbox.com/u/10839791/ld.txt

А вывод физического состояния диска: arcconf GETCONFIG 1 PD

https://dl.dropbox.com/u/10839791/pd.txt

Статус контроллера:

https://dl.dropbox.com/u/10839791/controller.txt

У меня вопрос: есть ли способ восстановить этот диск без потери данных.

Спасибо.

Я думаю, что ответ может заключаться в том, что контроллер adaptec будет восстанавливать только 1 диск за раз.

У меня есть контроллер Adaptec 5805Z в RAID 10 с 4 группами. Мы только что заменили 1 диск в каждой группе, и в настоящее время восстанавливается только 1 группа. Я знаю, что все заменяемые диски хороши, потому что мы запускали на них плохие блоки, кроме того, они определенно больше, чем диски, которые они заменяют.

@SkechBoy, знаете ли вы, завершилось ли восстановление вашей первой группы раньше, чем началось второе?

Обновление: только что получено подтверждение от Adaptec, что «контроллер обычно перестраивает сегмент за раз». Другими словами, вам нужно дождаться восстановления первой группы RAID, прежде чем она начнет восстановление второй.