Я подумываю заменить старый файловый сервер, совместно использующий один том RAID5, работающий на 6 дисках 10K об / мин с кэшем 8MB. На замену войдут 2 тома RAID10 по 4 диска в каждом. Новые диски имеют кэш 64 МБ ... но это только диски SATA со скоростью вращения 7200 об / мин (WD RE4). Тогда мой вопрос: как вы ожидаете, что эти два тома будут работать в сравнении?
Это уже сделано, но я задаю этот вопрос, потому что хотел бы иметь представление о том, чего ожидать, прежде чем я разверну это. Моя интуиция подсказывает мне, что новая система должна быть хорошим улучшением производительности, особенно из-за разделения на два тома вместо одного. Мне также любопытно, как бы все было, если бы у меня был только один новый том вместо двух.
Боюсь, я недооцениваю влияние скорости вращения старого массива. Я также волнуюсь, потому что, хотя я ожидаю, что новая система будет быстрее, она также больше, и, следовательно, в конечном итоге увидит увеличение абсолютного количества данных, передаваемых за единицу времени ... так что, вероятно, будет достаточно быстрее справиться с этим увеличением?
Поскольку я знаю, что это имеет значение, это для традиционного файлового сервера, который будет использоваться для подключенных дисков. Никакой базы данных, веб-серверов или чего-то подобного.
Если у меня будет возможность, я проведу несколько реальных тестов, чтобы сравнить новые и старые массивы с реальным использованием, и опубликую их после развертывания, но, опять же, настоящий тест не будет, пока новая система не обработает столько данных. передача относительно его размера как текущей системы.
Почему 2 x 4-дисковых-R10 - почему не 1 x 8-дисковый-R10 с двумя логическими дисками? Это будет работать намного лучше и в целом будет безопаснее.
Теперь перейдем к вопросу о 10k и 7.2k - хотя диски 7.2k по своей природе будут как минимум на 40% медленнее при случайных IOPS (да, не намного медленнее для последовательной работы), меня больше беспокоит то, что наибольшее количество 7.2k у дисков есть «рабочий цикл» 30%, то есть они предназначены для работы только 30% времени, и превышение этого уровня на самом деле ОЧЕНЬ сильно влияет на их MTBF. Я могу засвидетельствовать это, увидев буквально сотни дисков 7.2k менее чем за месяц на некоторых массивах, которые у нас были, переход на диски 10k уменьшил это число до единичных цифр - так что будьте осторожны, диски 7.2 не должны управляться все время нормально.
Отдельные диски, вероятно, имеют такую же или более высокую последовательную пропускную способность, чем старые, но более медленное время поиска из-за более низкой скорости вращения. 6-дисковый raid5 обеспечивает последовательную пропускную способность примерно на 5 дисков, но не так хорош при произвольном вводе-выводе, особенно при записи. Четырехдисковый raid1 + 0 (что на самом деле имеет в виду большинство поставщиков, когда говорят, что raid10) имеет последовательную пропускную способность около двух дисков, но обрабатывает случайный ввод-вывод лучше, чем raid5.
Учитывая это, я бы сказал, что если вы собираетесь использовать два raid10 по отдельности, то они будут работать немного хуже, чем старый raid5, если только ваша нагрузка не будет в основном случайной.
«Производительность» - это то, что сильно зависит от рабочей нагрузки, и по ней действительно сложно получить надежный прогноз. Рабочие нагрузки файлового сервера могут быть практически любыми - от в основном простаивающего до плохо-случайного чтения-записи-забитого. Но если бы пользователей устраивал старый RAID5, они, вероятно, не были бы недовольны RAID10. Хотя я бы не стал делать ставку на значительное повышение производительности - диски SATA имеют довольно высокое время поиска и постоянная случайная нагрузка (особенно при случайной записи вместе со случайным чтением) может снизить пропускную способность до обхода.
Разделение логических дисков имеет смысл только в том случае, если вы хотите изолировать различные типы рабочих нагрузок (т.е. вы не хотите, чтобы рабочая нагрузка A замедляла рабочую нагрузку B ни при каких обстоятельствах). Если вам не нужна такая изоляция, производительность повысится за счет большего количества шпинделей на одном логическом диске.
Кстати: тесты подходят для приблизительной ориентации, но чтобы действительно сделать вывод о том, что новая дисковая подсистема работает лучше, чем старая, вам необходимо усреднить данные производительности (пропускная способность, количество запросов, время запросов, длина дисковой очереди) из старый и новый массивы и сравнить.