Я довольно часто обсуждаю это с разработчиками. Контекст - это приложение, работающее в Linux, которое имеет средний объем дискового ввода-вывода. Это серверы HP ProLiant DL3x0 G6 с четырьмя дисками одинакового размера при 15 000 об / мин, поддерживаемые контроллером P410 и 512 МБ кэш-памяти на базе аккумулятора или флэш-памяти. Здесь есть две точки зрения, и я хотел бы получить обратную связь ...
1). Я считаю, что имеет смысл создать массив, содержащий все четыре диска, настроенных в RAID 10 (1 + 0), и разделить по мере необходимости. Это дает наибольший запас для роста, имеет преимущество использования большего количества шпинделей и большей отказоустойчивости без ухудшения характеристик.
2). Разработчики считают, что лучше иметь несколько пар RAID 1. Один для ОС и один для данных приложения, ссылаясь на то, что разделение шпинделей уменьшит конкуренцию за ресурсы. Однако это ограничивает пропускную способность, вдвое уменьшая количество дисков, и в этом случае ОС на самом деле не делает ничего, кроме обычного ведения системного журнала.
Вдобавок тот факт, что у нас есть RAID-кеш батареи и значительный объем оперативной памяти, похоже, нивелирует влияние задержки диска ...
Что ты думаешь?
Я думаю, что разговоры о представлении и прогулки по ямам.
Поскольку вы обсуждаете воссоздание массива, почему бы не сделать это в обоих направлениях и запустить на нем тестовую нагрузку, а затем построить график результатов?
редактировать
Если, как вы говорите в своем комментарии, эта реальная жизнь показывает, что производительность не зависит от базового уровня RAID (и у вас действительно есть цифры для его резервирования), то я бы рекомендовал перейти на уровень, который будет продолжать даст вам максимальную производительность при масштабировании, что почти всегда будет RAID-10.
Если вы не собираетесь расширяться, это буквально не имеет значения, поскольку вы, по-видимому, получаете одинаковую производительность от любого варианта, и вы покраска велосипедной хижины.
Поскольку никто не представил никаких реальных данных по этому вопросу, я хотел бы указать на интересную статью, посвященную тому же самому вопросу!
Из статьи:
«Как бы нам ни нравилась прямая последовательная пропускная способность, она почти бесполезна для большинства приложений баз данных и почтовых серверов. Эти приложения должны иметь дело с сотнями или даже тысячами крошечных запросов в секунду, которые выполняются случайным образом на жестких дисках. Диски буквально тратят более 95% времени выполняется поиск данных, а не чтение или запись данных, а это означает, что даже бесконечная последовательная пропускная способность решит в лучшем случае только 5% проблемы производительности ».
Пища для размышлений: если вы решите использовать 4-х дисковый RAID-10, то в любой момент в будущем разработчики могут указать вам пальцем, когда возникнет проблема с производительностью. Если вы выберете два набора, а затем возникнет проблема с производительностью, вы мощь есть возможность перейти на четырехдисковый RAID-10, в зависимости от того, насколько сложным будет это преобразование.