Назад | Перейти на главную страницу

с использованием процессора i7 «gamer» в кластере HPC

Я использую погодную модель WRF. Это очень параллельное приложение с интенсивным использованием оперативной памяти.

Для этого мне нужно построить кластер HPC. Я использую интерконнект Infiniband на 10 ГБ.

WRF зависит не от количества ядер, а от пропускной способности памяти. Вот почему Core i7 3820 или 3930K работает лучше, чем полноценные xeon E5-2600 или E7.

Похоже, университеты используют xeon E5-2670 для WRF. Стоит около 1500 долларов. Spec2006 fp_rates Тест WRF показывает, что i7 3930K за 580 долларов показывает то же самое с ОЗУ 1600 МГц.

Что интересно, i7 может обрабатывать оперативную память до 2400 МГц, что значительно увеличивает производительность для WRF. Тогда он действительно превосходит ксеон. Энергопотребление немного выше, но все же меньше 20 евро в год. Даже с учетом дополнительных деталей, которые мне понадобятся (блок питания, бесконечная полоса, корпус), i7 все равно на 700 евро дешевле, чем Xeon.

Итак, можно ли использовать «игровое» оборудование в кластере HPC? или я должен сделать это про с xeon?

(Это не критичное приложение. Я могу справиться с простоями. Думаю, мне не нужен ECC?)

Мы сделали это в мире высокочастотной финансовой торговли на короткое время (почти параллельно с HPC, учитывая архитектуру приложения, с которой я работал) ...

Примерно в начале 2010 года я развертывал пользовательские «игровые системы» i7 с одним сокетом 3U в стойке с 10GbE Solarflare (с участием OpenOnload UDP-сообщение, обход ядра) и / или межсоединения Infiniband.

У меня не было IPMI / внеполосного управления, управления питанием, отдельных источников питания и компонентов с возможностью горячей замены. Мы использовали как твердотельные накопители, так и внутренние диски SAS в разных точках, но диск не был критичным для вычислительных узлов. В качестве операционных систем использовалась Fedora Linux с сильно настроенным и настроенным ядром.

Это сработало в качестве доказательства концепции и было отложено до тех пор, пока мы не почувствовали, как наши торговые приложения будут реагировать на производственные данные в реальном времени. Однако по мере того, как дела росли, это превратилось в кошмар для менеджмента ...

Такие проблемы, как охлаждение, тепло / пространство / плотность центра обработки данных (это были блоки 3U), поддержка и удаленное управление, в конечном итоге свели на нет усилия. Хотя ЦП никогда технически не выходил из строя, у всех остальных компонентов есть проблемы!. И это было с 8-часовым производственным циклом в день ...

Что мы делали в долгосрочной перспективе?

Мы отказались от компьютеров для геймеров и остановились на соответствующем специализированном серверном оборудовании. Да, это была финансовая фирма, поэтому у нас не было бюджетных ограничений, но я по-прежнему Необходимо учитывать цены, учитывая потенциальный масштаб непроверенного приложения. Есть хорошие серверы во всех ценовых диапазонах, и если вы планируете расширяться, можно заключить сделки с производителями. Вы же не думаете, что большие кластеры исследовательских лабораторий HPC платят розничную цену за оборудование, не так ли? Мы тоже ...

Итак, если вы хотите это сделать, подумайте о картине в целом. Если вы просто думаете об использовании ЦП настольного уровня в аппаратном обеспечении серверного уровня, он будет работать ... Но я бы не рекомендовал его для постоянного использования.

Если вы знаете об ограничениях ЦП и проблемах с доступностью, связанных с этим, я могу предложить только точку данных для рассмотрения.

I7 не может использовать ОЗУ с буферизацией ECC и не может быть установлен в конфигурации с двумя или четырьмя сокетами. Это кажется достаточной причиной, чтобы не использовать его, но, конечно, ваши потребности могут диктовать иное.

Лично я по-прежнему склоняюсь к Xeon, поскольку он предназначен для поддержки одновременной нагрузки в течение более длительного периода времени. Если вы выполняете интенсивную работу с ЦП в течение длительного периода времени, скажем, часов или недель, у Xeon гораздо больше времени до отказа, чем у i7.

В остальном я полагаюсь на ответ @MdMarra относительно загрузки сервера.

Это очень параллельное приложение с интенсивным использованием оперативной памяти.

Звучит так, будто мощность процессора на ядро ​​не так важна, как количество ядер и объем оперативной памяти, которые вы можете поместить в коробку, чтобы быстрее масштабироваться. Имея это в виду, возможно, вы захотите использовать 16-ядерный Opteron в двойной процессор конфигурация. Это может не работать с DDR3-2400, но вы можете заполнить его 256 ГБ памяти DDR3-1600, распределенной по этим 32 ядрам процессора.