Назад | Перейти на главную страницу

Что считается «большим» массивом рейда 5?

Недавняя проблема с сетевым хранилищем Buffalo TeraStation в моем офисе побудила меня исследовать Raid 5.

Я нашел несколько разных статей, в которых говорится о непригодности использования raid 5 в больших массивах или с большими дисками.

Вот один пример статьи в котором говорится о проблемах с восстановлением массива с большими потребительскими дисками.

Я пытаюсь понять, что считается «большим»?

NAS, который у нас есть, представляет собой установку Raid 5 с 4 дисками, каждый диск составляет 1 ТБ. Диск вышел из строя и был заменен, массив в настоящее время восстанавливается.

Является ли эта установка такой же большой с точки зрения вероятности возникновения проблем во время восстановления?

Насколько надежна эта установка для повседневного использования?

Расчет надежности дискового массива:

  1. Найдите коэффициент URE для вашего диска (производители не любят говорить о выходе из строя своих дисков, поэтому вам, возможно, придется покопаться, чтобы найти его. Он должен быть 1/10 ^ X, где X обычно составляет около 12-18).
  2. Решите, какой уровень риска является приемлемым для ваших потребностей в хранилище †. Обычно вероятность отказа составляет <0,5%, но может составлять несколько процентов для «временного» хранилища и <0,1 для критически важных данных.
  3. 1 - ( 1 - [Drive Size] x [URE Rate]) ^ [Data Drives‡] = [Risk]
    Для массивов с более чем одним диском четности или зеркал с более чем парой дисков в зеркале измените 1 после Drives in Array к количеству дисков с четностью / зеркалом.

Итак, у меня есть набор из четырех дисков WD Green емкостью 1 ТБ в массиве. У них коэффициент URE составляет 1/10 ^ 14. И использую их как хранилище царапин. 1 - (1 - 1TB x 1/10^14byte) ^ 3 => 3.3% риск отказа при восстановлении массива после выхода из строя одного диска. Они отлично подходят для хранения моего мусора, но я не помещаю туда важные данные.

† Определение допустимого отказа - долгий и сложный процесс. Его можно резюмировать как Budget = Risk * Cost. Так что, если сбой будет стоить 100 долларов, и вероятность его возникновения составляет 10%, тогда вы должен иметь бюджет в 10 долларов, чтобы предотвратить это. Это значительно упрощает задачу определения риска, стоимости различных отказов и характера потенциальных методов предотвращения - но вы поняли идею. [Data Drives] = [Total Drives] - [Parity Drives]. Зеркало с двумя дисками (RAID1) и RAID5 имеет 1 диск четности. Зеркало с тремя дисками (RAID1) и RAID6 имеет 2 диска четности. Возможно наличие большего количества дисков с контролем четности с RAID1 и / или пользовательскими схемами, но это нетипично.


Однако это статистическое уравнение имеет свои оговорки:

  • Этот показатель URE является заявленным и обычно лучше для большинства приводов, сходящих с конвейера. Вы может повезти и купите диск, который на порядки лучше, чем рекламируется. Точно так же вы можете получить диск, который умирает от детской смертности.
  • Некоторые производственные линии имеют плохую работу (когда многие диски в процессе выходят из строя одновременно), поэтому получение дисков из разных производственных партий помогает распределить вероятность одновременного отказа.
  • Более старые диски с большей вероятностью умрут под нагрузкой при восстановлении.
  • Сказываются экологические факторы:
    • Диски, которые обычно подвергаются циклическому нагреву, с большей вероятностью умрут (например, при регулярном включении / выключении).
    • Вибрация может вызывать самые разные проблемы - см. Видео на YouTube ИТ кричит на дисковый массив.
  • «Есть три вида лжи: ложь, проклятая ложь и статистика» - Бенджамин Дизраэли.

Причина, по которой существует эта статья, - привлечь внимание к уровню неустранимых битовых ошибок на жестких дисках. В частности, ваши дешевые диски для домашнего ПК. Обычно они имеют заводскую спецификацию 1/10 ^ 14. Это около 12,5 ТБ данных, которые, если вы делаете RAID-5 с дисками 2 ТБ ... вы используете довольно быстро.

Это означает, что вам следует:

  • используйте меньшие группы RAID и соглашайтесь с большим объемом неиспользуемого пространства.
  • Используйте RAID-6 и примите дополнительный штраф за запись. (На 50% выше, чем у RAID5)
  • Покупайте более дорогие диски - «серверный уровень» имеет спецификацию UBER 1/10 ^ 16, что означает, что это спорный вопрос. (1,2 ПБ лучше, чем 12,5 ТБ)

Обычно я бы предположил, что RAID-6 - это путь вперед, но это будет стоить вам производительности.