Назад | Перейти на главную страницу

Необоснованные ожидания производительности для производительности RAID 0?

Я впервые собираю машину с аппаратной картой RAID. Мы купили Dell T620 с H710P RAID controller (1GB NV Cache), а 160GB Solid State Drive (SATA Read Intensive MLC 3Gbps), и два 3TB 7.2K RPM Near-Line SAS 6Gbps Hard Drives. Твердотельный накопитель в значительной степени предназначен для ОС, чтобы он постоянно работал.

Два диска SAS сконфигурированы с помощью RAID 0. Мы рассматриваем это пространство как пустое место для анализа, поэтому нас не беспокоит потеря данных. Нам нужен высокопроизводительный ввод-вывод, потому что мы имеем дело с большим количеством больших файлов. Например, мой текущий проект должен работать с 800 файлами размером от 100 до 200 ГБ. К сожалению, мне приходится переносить файлы на компьютер, анализировать их и удалять. Удивительно (для меня) то, что у меня одновременно выполнялось 8 заданий (передача, анализ, удаление), и каждое задание выполнялось более 20 часов (по сравнению с ~ 3 часами для одного задания). Я обнаружил, что процессоры ожидают ввода-вывода, согласно top (время ожидания завершения ввода-вывода колебалось около 20).

Я понимаю, что это диски со скоростью вращения всего лишь 7,2 тыс. Об / мин, но я предполагал, что они вполне способны, поскольку Dell указала их на скорости 6 Гбит / с. BeowulfNode42 упомянул Вот что некоторые диски имеют интерфейс 6 Гбит / с для рекламы, хотя они даже не могут заполнить канал 3 Гбит / с. Но я полагаю, что Dell не сделает этого с сервером высокого класса.

Я прогуливался по гуглу, чтобы проверить, были ли мои ожидания необоснованными, но не нашел ничего окончательного.

Вопрос: Что можно ожидать от этой установки? Очевидно, что IO - это горлышко бутылки. Карта RAID кажется довольно хорошей, и я подумал, что диски были довольно хорошими.

Я запустил hdparm, чтобы посмотреть, что у меня получается. Вот результаты:

>sudo /usr/sbin/hdparm -Tt /dev/sdb

/dev/sdb:
 Timing cached reads:   19542 MB in  2.00 seconds = 9778.47 MB/sec
 Timing buffered disk reads: 1028 MB in  3.00 seconds = 342.11 MB/sec

Кэшированные чтения довольно хороши, но я ожидал большего от буферизованных чтений. Я считаю, что теоретическая производительность для двух дисков 6 Гбит / с составляет 750 МБ / с, поэтому я ожидал получить около 600 МБ / с.

Я ценю вашу помощь. Другая соответствующая информация указана ниже. Пожалуйста, дайте мне знать, если я что-то пропустил.

OS: opensuse 13.1
RAM: 256GB (1866)
CPUs: Dual Intel Xeon E5-2650v2 2.6GHz, 20M Cache, 8.0GT/s QPI

6 Гбит / с - это скорость канала SAS, а не профиль ввода-вывода отдельного диска.

Обычно скорость в объединительной плате SAS согласовывается до наименьшего общего знаменателя, поэтому вы найдете медленные диски, которые по-прежнему поддерживают высокоскоростные каналы SAS, чтобы вы могли смешивать диски в одном (внешнем) корпусе или объединительной плате или для получения выгоды. из распараллеленного ввода-вывода, распределенного по большему количеству дисков.

Профиль ввода-вывода HP для аналогичных дисков SAS 3 ТБ, 7,2 тыс. 6 ГБ:

Накопители SAS Midline предназначены для серверов и систем хранения, где требуется большая емкость. Эти диски обладают умеренной ценой, надежностью и производительностью для некритичных приложений с низкой рабочей нагрузкой, таких как резервное копирование дисков, архивирование и эталонные приложения.

hdparm в лучшем случае указывает на чистую производительность диска, но, например, он полностью обходит файловую систему и не имитирует более случайный ввод-вывод, AFAIK. Взгляни на Какой хороший бесплатный тест для жестких дисков с открытым исходным кодом?

hdparm -T, по сути, проверит производительность чтения кэширования диска, то есть ЦП и памяти. Это проверяет, какую скорость чтения вы получите, когда файлы кэшируются в памяти (см. Раздел кеширования для бесплатной команды).

Накопители Nearline SAS не являются полноценными дисками SAS. Они имеют те же преимущества, что и диски SAS, поскольку используют интерфейс SAS, но по-прежнему являются механическими приводами со скоростью вращения 7200 об / мин. Значение hdparm -t, которое вы указали, примерно равно двум дискам в RAID0. Для сравнения, диски SATA емкостью 3 ТБ обычно имеют скорость около 150 МБ / с.

Для повышения производительности вы захотите добавить больше дисков. Возьмем, к примеру, Hadoop, где рекомендуется получить лучшую цену за гигабайт и использовать больше дисков и добавить больше серверов в кластер. Если вам нужна невероятная производительность HD, лучше подойдут твердотельные накопители большей емкости, хотя интенсивное использование может вызвать ранние сбои из-за более частых циклов чтения / записи.