Назад | Перейти на главную страницу

Деградированный массив. RAID 6 с отказом трех дисков

У меня есть массив дисков с RAID 6 и 16 дисками. Дней назад три диска вышли из строя, и массив был помечен как деградированный. Я не могу получить доступ к данным и не могу загрузиться в Оперативную систему. Мне нужен доступ к данным, но я ничего не могу сделать. Любой совет? Как я могу восстановить данные или получить к ним доступ? Могу ли я использовать Live CD для загрузки ОС? Я использую SAS Disk. заранее спасибо

Как было сказано ранее, если более двух дисков в массиве RAID-6 умирают, массив невозможно восстановить.

Однако одновременный отказ трех дисков является довольно маловероятным событием: это вполне может быть случай неисправного корпуса, объединительной платы и / или контроллера.

Вам следует попробовать удалить и снова вставить диски, заменить контроллер и / или корпус и даже поместить диски на другой сервер с тем же контроллером (если он у вас есть).

Вы не даете никаких подробностей о типе сервера, типе RAID-контроллера или о чем-либо конкретном.

Попробуй выключить все на 10 минут ... Отключить сервер. Пусть диски замедлятся.

Снова включите сервер и посмотрите, распознает ли RAID-контроллер повторно диски и сможет ли он загрузиться.

Как указано в комментарии, RAID6 может выдержать до двух сбоев дисков; если третий диск выходит из строя, ваш массив тост.

Самое очевидное - восстановить из резервной копии. Если это невозможно и хотя бы один из вышедших из строя дисков все еще доступен для чтения (хотя и с ошибками чтения), вы можете попытаться создать блочную копию каждого отказавшего диска на другом исправном диске (например, через ddrescue <failed_disk> <new_disk>) и перезапустить массив, используя эти копии (плюс другие исправные диски).

Вы закончите с проколотыми массивами, где некоторые исходные данные могут быть потеряны / повреждены; однако, если повезет, большая часть данных должна быть доступна.

Если у вас нет резервной копии и ни один из вышедших из строя дисков не читается, вам необходимо обратиться в службу спасения данных.

  1. У вас, вероятно, нет программного RAID, что бы ни говорилось на бирке. Вы не можете загрузить ОС с программного RAID6.

  2. Сбой 3 дисков из 16 - довольно редкое явление, за исключением случаев, когда сервер падает на пол. Это либо 3 диска, которые выходят из строя один за другим в течение длительного периода времени и никто не замечает, либо отказавший контроллер, отказавший кабель, отказ источника питания, отказ объединительной платы или ошибка прошивки. Важно определить, какой именно случай у вас возник, потому что стратегия восстановления другая. Могут быть доступны журналы BIOS или RAID-контроллера.

  3. В любом случае вы начинаете с резервного копирования каждого отдельного диска на другой носитель, используя другой известный рабочий контроллер. В процессе вы увидите, сколько дисков действительно сломано и сколько.

  4. Большинство (возможно, все) аппаратные RAID-контроллеры - дерьмо. Я узнал на своей шкуре. Состояние «сбой диска» на самом деле может быть одним поврежденным сектором, и большая часть (или даже все) данные могут быть восстановлены.

  5. «Ухудшенный» массив - это массив, в котором все еще доступны все данные. То, что вы описываете, является скорее "отказавшим" или "автономным" массивом, чем "деградировавшим". Если у вас нет опыта в этих вопросах, позвоните кому-нибудь, кто ЕСТЬ.

  6. Запуск с восстановления / live CD может быть, а может и не быть частью процесса. Если вы не знаете, как смонтировать файловую систему в режиме только для чтения, позвоните кому-нибудь, кто знает. Такой ошибкой можно убить идеально восстанавливаемые данные.


После множества бессонных ночей я проектирую свои серверы таким образом, что все перестает работать, когда выходит из строя ПЕРВЫЙ диск. ЭТО единственное сообщение об ошибке, которое никто не игнорирует.

Восстановить из резервной копии. Вы больше не увидите свои данные на этом RAID LUN.

RAID 6 может выдержать только два вышедших из строя жестких диска. Если у вас нет резервных копий и вам нужны данные, я бы порекомендовал нанять компанию по восстановлению жестких дисков. Я бы не стал пытаться восстанавливать данные самостоятельно, потому что чем больше вы работаете с жесткими дисками, тем выше вероятность того, что данные не удастся восстановить.

в качестве крайнего варианта (попробовав все, что другие уже опубликовали здесь в качестве ответа), вы можете попытаться принудительно настроить один диск как подключенный / не деградированный.

У меня был случай, когда 3 из 6 очень старых дисков в аппаратном рейде 6 вышли из строя. Мне повезло, и я смог восстановить некоторые данные:

  1. удалил 2 вышедших из строя диска
  2. в параметрах моего аппаратного рейд-контроллера я принудительно подключил третий отказавший диск (не деградировавший)
  3. вставил 2 новых диска
  4. перестроил массив
  5. и теперь удалил последний отказавший диск

Мне повезло, и я не потерял никаких соответствующих данных, но, конечно, при таком подходе существует риск повреждения / потери данных, но в противном случае данные рейда теряются, так что, возможно, стоит попробовать, если рейд-контроллер предоставит такую ​​возможность.