У нас есть небольшой кластер, где я работаю и за которым ухаживаю. Узлы работают под управлением CentOS 7.5. Наши старые узлы используют процессоры Xeon E5 v4, в основном E5-2699 v4. Со старыми узлами Intel Turbo Boost работает правильно, и отдельные ядра ЦП могут свободно увеличиваться до максимальной частоты Turbo Boost, как указано в спецификациях ЦП.
Проблема в наших новых системах. Большинство из них оснащены Xeon Gold 6152 ЦП. Они будут увеличиваться только до базовой частоты (2,1 ГГц) и никогда не будут превышать ее. В lscpu
также указывает, что это максимальная скорость процессора, при этом должен означает, что максимальная частота составляет 3,7 ГГц (максимум в режиме Turbo).
Я подозреваю, что проблема связана с драйвером контроля скорости. В старых системах команда cpupower frequency-info
указывает, что драйвер - "intel_pstate". Однако в более новых системах эта команда указывает, что драйвер - «acpi-cpufreq». Мне это кажется «драйвером по умолчанию для управления скоростью процессора, когда специализированный не работает».
Из исследований, которые я провел до сих пор, я узнал, что acpi-cpufreq - это модуль ядра, а intel_pstate, похоже, является частью ядра.
Что можно сделать, чтобы правильно управлять скоростью наших новых систем и получить полный доступ к указанным максимальным турбо-скоростям?
Мы уже проверили, что турбо включен в настройках BIOS.
(У нас также есть такая же проблема с нашим ATOM C3955 Процессоры.)
Решили, по крайней мере, на предварительном тестировании.
Как предположили @silmaril и @Michael Hampton, проблема заключалась в ядре. Я обновил его до 4.19.8-1.el7.elrepo.x86_64, и теперь система на базе процессора Xeon Gold 6152, на которой я его пробовал, теперь сообщает правильные 3,7 ГГц в качестве максимальной скорости процессора. Также сообщается, что драйвер управления частотой теперь называется "intel_pstate".
Я следовал инструкциям от Эта статья, который в основном требует добавления репо из ELRepo (которые компилируют новые ядра и другие вещи для CentOS / RHEL), затем загружают и устанавливают новейшее ядро, которое у них есть.
РЕДАКТИРОВАТЬ: Я также проверил это на системах на базе ATOM C3955, которые у нас также есть. Результаты были немного более ... сомнительными. Проверка с помощью таких команд, как lscpu
и cpupower
Похоже, это указывает на то, что процессор все еще застрял на максимальной скорости на базовой тактовой частоте. Однако при работе с большой нагрузкой тактовые частоты процессора будут отображаться на уровне (или близком) к максимальному турбо-режиму процессора с помощью команды watch -n.1 'cat /proc/cpuinfo | grep -i mhz'
. Так что работает, но не идеально.