Назад | Перейти на главную страницу

QNAP ts-1679u-rp восстановление RAID 6 в неправильном порядке

У меня qnap ts-1679u-rp работает на RAID 6. Он имеет ошибку 2 диска. Поэтому я заменил 2 диска (Диск 3 и Диск 13) новым диском той же модели и емкости.

Восстановить не удалось.
1. Я попытался вернуть старый диск, но забыл его порядок. Так что я все равно вставляю его в (Диск 3 и Диск 13).
2. Не запускается.
3. Я поменял местами и пробую снова. он не запустился.
4. Я подключаю VGA к QNAP, чтобы увидеть экран консоли.
5. Он сказал, не может подключиться из-за ошибки чтения диска 6.
6. Пытался вытащить все 3 диска (Диск 3, Диск 13, Диск 6). Он запускается, и, наконец, доступен веб-интерфейс, но формат диска не распознается. Я не могу получить доступ к своему диску.
7. Включив питание, я толкаю диск 3, диск 13, диск 6 внутрь. Он все еще не может получить доступ к моему диску.

Думаю, я испортил конфигурацию RAID. Я потеряю свои данные? Как мне восстановиться после этой неудачи?

Всего 16 дисков. Я использовал все 16 дисков для RAID 6. 16x4TB.

Так же часто, как и с RAID-массивами, если вы не можете заставить его восстановить себя, все готово. Похоже, что диск 6 тоже мог выйти из строя. С потерей трех дисков (даже если RAID-контроллер галлюцинирует эту потерю), ваши данные практически исчезли.

Я вижу, у вас нет резервных копий. Это очень плохо. Но я полагаю, что до конца вашей карьеры вы могли бы начать правильно использовать RAID. Это множество вещей - способ распределения рабочей нагрузки для повышения производительности и способ уменьшить непосредственное воздействие сбоя на работу, которое в противном случае потребовало бы восстановления из резервной копии. Его даже можно использовать для ограничения потери данных в случае сбоя, краткосрочного (т.е. меньше, чем ваш интервал резервного копирования). Но RAID есть не:

  1. Заменитель резервных копий. У вас может быть серьезный сбой диска, или контроллер RAID может выйти из строя, или ваши данные могут быть потеряны по бесчисленному множеству других причин, которые приводят к их разрушению программным обеспечением или природой.
  2. Лицензия на игнорирование сбоев дисков или использовать подозрительные диски. Если вы подозреваете сбой диска, вы должны немедленно исправить это.

Когда в будущем вы будете проектировать RAID-массивы, вам следует очень внимательно рассмотреть вероятность катастрофического сбоя, прежде чем вы сможете его исправить. С массивом RAID 1 из двух дисков вероятность того, что оба они выйдут из строя одновременно, довольно низка, но в вашей настройке только три из 16 (19%) должны были выйти из строя. Основная вероятность предполагает, что массив хрупкий. Используйте массивы с меньшим количеством дисков или большим количеством допустимых сбоев. Несколько томов могут помочь; агрегировать тома RAID с использованием составных уровней, таких как RAID 10 и RAID 60. Массив RAID 60 выдержит до 4 отказов (до 2 в одной половине), и, скорее всего, все будет в порядке.

Чтобы немного расширить эту концепцию, при использовании RAID рассмотрите возможность использования горячего резервирования. «Горячие» резервы - это круто, потому что массив может сразу начать восстановление и намного быстрее выйти из деградированного состояния. По сути, они добавляют диски к отказоустойчивости вашего массива, если отказы не так сильно сгруппированы, чтобы предотвратить своевременное восстановление.

Также примите во внимание время, необходимое для восстановления массива. Копирование диска емкостью 4 ТБ занимает некоторое время, и это одна из причин, по которой дисковые массивы обычно строятся с меньшими дисками (есть и другие причины).

В заключение:

  • Используйте качественные диски. Проверьте MTTF, если указано. Используйте корпоративные. На премию есть причина. Избегайте «зеленых», которые чрезмерно циклируют, чтобы сэкономить электроэнергию, и т.п.
  • Маркируйте свои диски. Тогда вы не забудете, в каком порядке они идут.

Надеюсь, этот урок не был слишком дорогим.

К счастью, мне удалось восстановить свои данные. Вот как я это делаю:

  1. Я набрал vi /etc/raidtab чтобы увидеть порядок дисков. Мне удалось поменять порядок дисков обратно на диск 3 и диск 13
  2. Ошибка для
[ 984.796055] ata1.00: cmd 25/00:20:60:04:5a/00:00:5a:00:00/e0 tag 2 dma 16384 in    
[ 984.796055] res 40/00:01:00:00:00/00:00:00:00:00/00 Emask 0x14 (ATA bus error)    
[ 984.796058] ata1.00: status: { DRDY }    
[ 984.796066] ata1.00: hard resetting link    
[ 985.520017] ata1.01: hard resetting link    
[ 985.996057] ata1.00: SATA link up 3.0 Gbps (SStatus 123 SControl 300)    
[ 985.996068] ata1.01: SATA link down (SStatus 4 SControl 300)    
[ 986.012323] ata1.00: configured for UDMA/133    
[ 986.012331] ata1.00: device reported invalid CHS sector 0    
[ 986.012340] ata1: EH complete    

У Drive 6 проблема с установкой соединения. Так что я подозреваю, что ссылка неактивна. Поэтому я слегка вдавливаю диск с большей силой и пробую снова. Интересно, что на этот раз ссылка открыта! Таким образом, у меня осталось только 2 отказа диска.

  1. тип mdadm -E /dev/sda3 чтобы проверить состояние диска. Я так делаю для всех 16 дисков. sda3 в sdp3. Диск 3 и Диск 13 помечены как неисправные.

  2. тип storage_boot_init 2 собрать все на 16 диск. К счастью, данные наконец-то доступны на \share\MD0_DATA и \share\ папка.

Должен признаться, раньше я мало что знал о RAID 6 и слепо использовал его. Теперь, когда я могу вернуть свои данные, я сделаю резервную копию где-нибудь в другом месте, прежде чем восстановить 2 неисправных диска. Я уже пометил все свои диски. Усвоил урок! Для меня это настоящий кошмар с данными!