Назад | Перейти на главную страницу

В чем заключаются недостатки «несбалансированного» RAID1?

Контекст: у меня есть сервер с двумя дисками NAS по 3 ТБ в RAID1 (Linux dmraid), и я хочу удвоить емкость хранилища, но у меня есть только один свободный отсек для дисков. Я мог бы купить два диска по 6 ТБ, но я подумал, что, возможно, мне сойдет с рук покупка только одного и переделка массива следующим образом:

Меня не волнует процесс изменения формы, поскольку он должен быть довольно простым:

  1. Конечно, сделайте резервную копию содержимого.
  2. Увеличьте существующий RAID1 до 3 устройств, добавив диск 6 ТБ.
  3. Дождитесь завершения повторной синхронизации.
  4. Выведите из строя два устройства емкостью 3 ТБ. (Массив ухудшается.)
  5. Уменьшите массив до 2-х устройств.
  6. Создайте RAID0 на двух устройствах емкостью 3 ТБ.
  7. Добавьте RAID0 в качестве второго устройства к RAID1.
  8. RAID1 повторно синхронизируется и больше не ухудшается.
  9. Измените размер RAID1, увеличив его с 3 ТБ до 6 ТБ.

Все это должно быть выполнено онлайн.

Однако я хочу убедиться, что это здравомыслящий. Все диски будут одного производителя и одной серии (WD Red). Для меня не столько производительность, сколько надежность.

С какими проблемами я могу столкнуться эксплуатация и обслуживание такой массив? (Я не спрашиваю о процессе миграции / изменения формы; меня вполне устраивает эта процедура.)

Будет ли преимущество в производительности или надежности иметь устройство RAID1 (диск 6 ТБ или RAID0 3 ТБ + 3 ТБ), помеченное как предназначенное для записи? Например, поскольку RAID0 содержит более старые диски, не продлит ли срок службы этих дисков, в основном, запись на устройство RAID0?

Вы делаете то же самое, что и мы в нашей (небольшой) компании. Мы увеличили размер нашего массива RAID1 с начального 1 ТБ до 4 ТБ, аналогично тому, что вы описываете, сначала купив один или два диска большего размера, а затем дополнив новый большой массив более крупными дисками, поскольку некоторые из меньших были удалены из массив из-за сбоя или потому, что они были необходимы для замены других (даже меньших) отказавших дисков на других ПК в компании.

Мы не слишком беспокоимся о производительности, и мы видели разные выступления за эти годы, поэтому я не могу об этом говорить.

Нас больше беспокоит надежность (как и вы), и я могу сказать вам, что наш RAID-массив представляет собой массив 3-RAID1 плюс внешний резервный, который каждый день повторно синхронизируется и заменяется одним из дисков 3-RAID1. Внешний резерв предназначен для аварийного восстановления: в случае, если какое-то событие разрушит все диски в массиве, мы можем сразу начать с данных предыдущего дня.

При использовании RAID1 с 2 дисками вы должны беспокоиться о времени повторной синхронизации, когда вы вставляете новый диск для замены вышедшего из строя, что может составлять несколько часов для массива 6 ТБ. Вы остаетесь с надежностью одного диска в течение этих часов. Я думаю, что с такими большими дисками лучше иметь как минимум трехдисковый RAID1.

tl; dr: Убедитесь, что эти диски меньшего размера более надежны.

Вы бы поступили как старый метадиск SunOS, с интересными обновлениями, когда диски SCSI стоили слишком много долларов. ;) То, принадлежат ли диски одному и тому же производителю, практически не влияет на то, что заботит ОС. Приятно стандартизировать одну точную модель, заводское происхождение и версию платы, потому что тогда платы контроллеров можно менять местами, если плата выходит из строя. (Если у вас есть чистая коробка, как у Луи Россманна, вы даже можете менять пластины местами между дисками.)

Pf = вероятность отказа

D # = номер диска #

Надежность RAID0 составляет Pf (D0) * Pf (D1)

Надежность RAID1 составляет 1 - (1 - Pf (D0)) * (1 - Pf (D1))

Что приводит к общему Pf = 1 - (1 - Pf (D0)) * (1 - Pf (D10) * Pf (D11))

В качестве справки в будущем ознакомьтесь с блогом BackBlaze, чтобы узнать о текущих конкретных, очень надежных моделях дисков, чтобы получить качественные диски по относительно низкой цене и избежать проблемных дисков. Существуют диски для розничных потребителей с явно лучшими показателями MTTF / MTBF, чем у корпоративных дисков, и к тому же они намного дешевле.

Ссылки

http://www.eventhelix.com/RealtimeMantra/FaultHandling/system_reliability_availability.htm#.W5deNaRlCEc

https://www.backblaze.com/blog/