У меня есть DL580 G7 с четырьмя E7 4870 и 128 ГБ оперативной памяти (восемь картриджей по 2x 8 ГБ каждый). Операционная система - Ubuntu 18.04. На pcie16 есть TITAN X и установлен обязательный p410i, но никакой другой периферии. Когда я тестирую эту систему, я получаю около 50% производительности, которую она должна дать. Например, это эталонный тест DL580G7 с немного более слабым процессором (E7 4850) и аналогичной настройкой.
Однако моя система способна обеспечить только половину производительности в том же тесте (я получаю около 980 для процессора и 20000 для многоядерной производительности). Это не кажется правильным.
Тест показывает все 80 ядер и 128 ГБ оперативной памяти, поэтому оборудование распознается правильно.
Я уже прошел контрольный список настройки низкой задержки HP и соответственно изменил BIOS. Все настройки мощности в ILO3 выставлены на максимальную производительность.
Ubuntu настроен на "регулятор производительности" на всех 80 ядрах.
Я заметил, что даже когда я подвергаю систему большой нагрузке (например, вычисление чисел на всех 80 ядрах при 100% использовании ЦП в течение нескольких часов), тепло ЦП практически не меняется (они остаются на уровне 40 градусов), а вентиляторы не вращаются. вообще (они остаются на уровне 40%). Общая потребляемая мощность, отображаемая в ILO3, достигает 650 Вт, но я ожидаю, что она будет ближе к 1 кВт в стрессовых условиях. Я немного озадачен этим.
Я уже пробовал разные версии BIOS. Первоначальный BIOS был выпущен 01.07.2013, что вызывало проблемы с производительностью и у других пользователей (такие отчеты можно найти в Интернете). Поэтому я понизил его до 12 марта 2012 г., и проблема осталась.
Кроме того, когда я сравниваю производительность этой машины с моей предыдущей машиной (с i5 4460), я заметил падение одноядерной производительности в четыре раза в моих приложениях (для вещей, не требующих интенсивного ввода-вывода, таких как добавление большого количества векторов), что согласуется с результатами тестов, но падение одноядерной производительности в два раза было бы тем, чего я ожидал. Меня беспокоит только производительность процессора. Насколько я могу судить, с RAID все в порядке, ввод-вывод соответствует ожиданиям (но может также пострадать из-за снижения производительности процессора).
Когда я делаю cat /proc/cpuinfo
во время стрессовых периодов я вижу, что процессор работает на частоте 2,2 ГГц.
Пока что я еще не тестировал другую операционную систему. Я сделаю это, как только у меня появится возможность перезагрузить машину.
Я скучаю по подобным вопросам о сбое сервера ... но в то же время это не общий запрос.
Сервер старой архитектуры. Вы делаете некоторые предположения, которые могут вести вас по ложному пути.
Мои рекомендации:
Вам не следует полагаться только на функции, рекомендованные в руководстве по настройке HP Low-Latency. Это предназначалось для специализированных приложений, таких как алгоритмическая торговля, где целью является детерминизм и предсказуемое использование ресурсов. Характеристики производительности в реальном времени и низкая задержка не обязательно означают Быстрее.
Я бы посмотрел на возможности процессора и поработал бы оттуда ...
Intel Xeon E7-4870
Запущен в 2011 году, срок эксплуатации закончился где-то в 2015 году.
Это процессор с поддержкой Turbo Boost. Максимальная частота в режиме турбо составляет 2,80 ГГц. Когда вы используете фиксированный параметр, например «Статический высокопроизводительный режим HP», он фактически отключает Turbo Boost. В этой ситуации вам лучше использовать режим управления ОС в вашей версии Linux. (Я также рекомендую это для систем VMware!)
Внутри вашей ОС посмотрите, можно ли установить powertop
и turbostat
.
Следите за одним или обоими во время выполнения вычислений.
Я удивлен, что вы смотрите на температуру процессора или энергопотребление. Я никогда не использовал это как показатель того, что делает сервер. Что ты являются отсутствует при использовании Ubuntu (обычно не поддерживается на оборудовании HP ProLiant) отсутствует взаимодействие между ОС и процессором управления ILO. Это одно из преимуществ оборудования ProLiant. В случае с системами baremetal я стараюсь использовать ОС, подобную RHEL / CentOS, из-за возможности мониторинга оборудования и интеграции работоспособности.
Также вернитесь к самой последней версии BIOS. Редко есть причина для перехода на более раннюю версию прошивки системы HP. Также убедитесь, что у вас актуальная прошивка ILO3.
Проверьте настройки управления питанием в BIOS. Убедитесь, что они настроены на управление ОС. Параметры управления питанием HPE BIOS по умолчанию приводят к хорошему энергопотреблению, но низкой производительности.
Обычно этот параметр можно найти в: Управление питанием> Регулятор мощности HP> Режим управления ОС.
ЦП XEON E7-4870 содержит 10 физических ядер. (https://ark.intel.com/products/53579/Intel-Xeon-Processor-E7-4870-30M-Cache-2-40-GHz-6-40-GT-s-Intel-QPI-) Эта конфигурация сервер / процессор содержит только 40 ядер, а не 80, как указано. Неужели вы путаете ядра и потоки? Кроме того, этот ЦП может достичь максимальной тактовой частоты 2,8 ГГц только с 4 активными ядрами. Таким образом, всего 16 ядер на 2,8 ГГц против 40 ядер на 2,4 ГГц.
DL580 G7 имеет конфигурации памяти, которые также необходимо учитывать. Наивысшая пропускная способность памяти, достижимая в этой системе (оптимизированный режим полусферы https://support.hpe.com/hpsc/doc/public/display?docId=c02283239#N100AB ) требуется 64 модуля DIMM с четырехрядным рейтингом.
Я знаю, что мой ответ запоздал с игрой, но может помочь будущим поисковикам; и я не имею репутации комментатора.
Комбинация вещей пошла не так, и вчера вечером я наконец нашел решение! Сработала комбинация понижения версии ПЗУ и установки регулятора мощности на управление ОС. ** Изначально на этом (бывшем в употреблении) сервере был установлен неисправный BIOS 01.07.2013 (см. [https://blog.netnerds.net/2014/02/solved-degraded-performance-on-hp-dl580-g7-on-bios-v-7012013/]), что сделало любое изменение настройки регулирования мощности на ПЗУ неэффективным. ** хотя система давала только 50% производительности, команда cat / proc / cpuinfo вернула скорость 2,2 ГГц на ядро (немного ниже, чем максимальное значение 2,4, но далеко от 50%. ). Этот результат соответствовал тому, что сообщили другие инструменты, такие как турбостат. Действительно, очень странно, и этот факт только усилил мое замешательство. * Я пытался отключить c-состояния при запуске Linux, но это не помогло (не лучше и не хуже). * Наконец, теперь я получаю 2100 на одноядерном и 36000 на многоядерном geekbench. Это примерно верно с отключенной гиперпоточностью. Я предполагаю, что после некоторой терпеливой настройки можно будет преодолеть отметку 40000 для многоядерного geekbench, но на данный момент я доволен.
Что действительно раздражало меня, так это то, что все инструменты для ЦП сообщали о частоте ядра не менее 2,2 ГГц, но моя система была мучительно медленной. Я думаю, что это должно быть странная ошибка в ПЗУ от 01.07.2013. Я согласен с тем, что лучше всего будет обновить прошивку ROM / ILO до последней, у меня еще не было времени серьезно попробовать.