Я планирую создать некоторую схему хранилища, но мне нужно предвидеть простои, обслуживание и время восстановления.
Некоторые ребята сказали мне, что перекомпоновка 10-дискового RAID6 из 10To (SATA) продлится около недели! и некоторые политики компании требуют прекращения работы с массивом при восстановлении.
Если я использую RAID 5 или 6 или 5 + 1 или 6 + 1, есть приблизительная формула, которая может дать мне подсказку о времени восстановления в зависимости от размера и типа диска (SAS / SATA / SSD). что-то вроде об / мин x размер (Мб) x типоразмер x кол-во дисков ...
Я хотел бы иметь возможность предвидеть весь сценарий восстановления в зависимости от размера / типа RAID / типа диска.
Я знаю, что это может зависеть от качества оборудования, но пусть говорит, что у меня нет специального оборудования, такого как 3PAR / STOREWIZE / NETAPP или подобных. Я использую обычные серверы с традиционными дисками SAS или SATA с программным RAID.
Вы можете довольно просто рассчитать скорость восстановления в лучшем случае: поскольку восстановление является последовательным, необходимое время составляет capacity / transfer rate
. Например, для восстановления диска 10 ТБ со скоростью передачи 200 МБ / с требуется как минимум 10000000 / 200 = 50000s = ~14h
.
Теперь возьмем этот результат и выбросить это, поскольку это слишком оптимистичный сценарий: он предполагает 100% доступность диска для операции восстановления и полностью последовательные операции чтения / записи. Добавьте в микс некоторую нагрузку без перестроения (например, приложение), ограничьте само перестроение до 30% (чтобы не заставлять другие приложения останавливаться), и вы внезапно оказались в 10x (например, неделя) время восстановления.
Это долгое время восстановления является причиной того, что я избегаю RAID5 / 6 во многих системах, отдавая предпочтение зеркалированию. В любом случае, с такими большими дисками категорически избегайте RAID5, который слишком подвержен двойному отказу и / или проблемам с URE.
Если хотите поиграть с числом, посмотрите Вот
Теоретическое абсолютное минимальное время восстановления - это время, необходимое для записи всего объема данных на диск: емкость диска, деленная на среднюю постоянную скорость записи, которую диск может поддерживать без кеша.
(Примечание: средняя устойчивая скорость записи, вероятно, даже не приблизится к значениям производительности, указанным в спецификациях.)
Диски большего размера занимают больше времени.
Более медленные диски занимают больше времени.
Расчет четности требует дополнительного времени.
Реальные цифры будут отличаться, но, безусловно, будут (намного) больше и будут зависеть от вашего уровня RAID, количества оставшихся дисков, нагрузки на систему во время восстановления массива, контроллера и т. Д.
Также см Каковы различные широко используемые уровни RAID и когда их следует учитывать?
Это зависит от вашего RAID-контроллера (или программного стека RAID). Как уже упоминалось, сначала не используйте RAID-5 с большими жесткими дисками (подходит для SSD до 1 ТБ и не более того).
По моему опыту, время восстановления во многом зависит от запроса хранилища. Для простаивающих систем большинству контроллеров потребуется от 36 до 72 часов для восстановления массивов из 8–12 ТБ (в зависимости от типа контроллера и размера диска).
Однако, когда система находится под нагрузкой ввода-вывода во время перестройки, нередко можно увидеть, что эта продолжительность увеличивается до недели.
Обратите внимание, что приводы с гелием имеют гораздо лучшие показатели надежности, чем стандартные приводы; По моему опыту, частота отказов приводов UltraStar He достаточно низка, чтобы по-прежнему использовать RAID-6 (типичная система от 100 ТБ до 1 ПБ не требует более одной перестройки за 5 лет).