Я устанавливаю JBOD, содержащий 44 жестких диска SAS 4 ТБ, 7200 об / мин. Я выбрал RAID 60, так как предпочитаю защиту от сбоев диска улучшениям производительности, предлагаемым RAID 10. Моя проблема заключается в том, как выбрать оптимальные диски для каждого участка, которые позволили бы сократить время восстановления. Например, если я оставлю 4 горячих резерва, это приведет к 40 дискам для следующих возможных конфигураций RAID:
Я склоняюсь к 4 участкам по 10 дисков, поскольку он, кажется, предлагает лучший баланс отказоустойчивости (допускаются 2 из 10 сбоев дисков на один диапазон) и полезной емкости (80%, по сравнению с 90% для 2 участков по 20 дисков).
Однако какое время перестройки можно ожидать для одного участка из 10 дисков? Веб-поиск показывает, что даже 10 дисков может оказаться невозможным, так как восстановление может занять слишком много времени, что может привести к отказу дополнительного диска во время восстановления. Однако многие ресурсы в Интернете основаны на меньшем количестве дисков или дисках меньшей емкости.
Есть ли какие-либо мысли относительно того, что является оптимальной настройкой для этого относительно большого количества дисков?
ПРИМЕЧАНИЕ. Существует политика резервного копирования около 10 ТБ данных, но невозможно создать резервную копию всех данных. Следовательно, я склоняюсь к RAID 60 вместо RAID10. Я понимаю, что это не замена резервному копированию, но лучшее восстановление после сбоя диска делает систему более устойчивой, предоставляя возможность перестроить, а затем перенести данные в другое хранилище в случае возникновения нескольких сбоев дисков.
РЕДАКТИРОВАТЬ: Технические характеристики:
Спасибо вам за помощь.
С дисками 4 ТБ 7,2k я бы рекомендовал сделать подмассивы как можно меньше - на самом деле, 5 дисков вообще не оправдывают использование RAID 6.
Мой 2c - использовать RAID 10, где вы можете ожидать завершения перестройки в течение 12 часов, чего, скорее всего, не будет в массиве RAID 6 с 5 дисками 20 ТБ.
Убедитесь, что вы включили ежемесячную очистку данных / патрулирование носителей / как там это называется, чтобы обнаруживать ошибки чтения, прежде чем они смогут остановить восстановление. Чаще всего, когда восстановление не удается, причиной является не полностью отказавший диск, а довольно старая, но необнаруженная ошибка чтения, которую можно было исправить с помощью регулярной очистки.
Основываясь на полученных замечательных комментариях, я попытался создать RAID60, состоящий из 5 участков по 8 дисков в каждом, по следующим причинам:
Основываясь на недавней перестройке, которая включала 2 участка по 20 дисков, я считаю, что время перестройки для конфигурации 8 + 2 является разумным.
Полезная емкость незначительно уменьшается по сравнению с участками с большим количеством дисков (например, 10 или 20 дисков на участок). Хотя потеря 20 ТБ кажется значительной, меньший размер диапазона означает, что восстановление будет осуществимо, и это приемлемый компромисс.
Я дополню этот ответ любой собранной мной дополнительной информацией.
Изменить: удален RAID5 как жизнеспособный вариант.
С современными аппаратными RAID-контроллерами от Avago (LSI) или Microsemi (Adaptec) идеально подходят RAID-массивы с 20 + 2 дисками. Время восстановления приемлемое (менее 24 часов). В любом случае, нынешние диски имеют очень низкую частоту отказов. Я бы определенно использовал 2 пролета.
На таком большом массиве я бы действительно используйте RAID10 или аналогичную настройку с зеркалированием ZFS. Вы можете установить 42-дисковый RAID10 + 2 глобальных горячих резерва (для полезного пространства ~ 82 ТБ), и это обеспечит отличную защиту от сбоев дисков. с участием очень быстрое время восстановления.
Если вы действительно хотите использовать RAID6, я склоняюсь к 5x 10-дисковым пролетам.