Назад | Перейти на главную страницу

Xeon E5 V3 - ЦП 2S против 4S - Влияние размера кэша L3 на производительность

Я попытался найти ответ на этот вопрос, но мне было трудно получить конкретную информацию, поэтому решил спросить здесь. Извините за сложное название, но суть моего вопроса такова: в семействе процессоров Xeon E5 V3 SKU 4S часто имеют больше кэша L3, чем SKU 1S / 2S; дает ли это материальную выгоду при использовании 4S SKU в конфигурации с одним / двумя процессорами?

Например, рассмотрим следующие 2 примерно одинаковых чипа: E5-2620 v3 и E5-4655 v3. Они оба имеют 6 ядер / 12 потоков, оба имеют максимальную частоту турбонагнетателя 3,2 ГГц, идентичный кэш L1 (6x32 КБ, 8-позиционный набор ассоциативных инструкций / данных), идентичный кэш L2 (6x256 КБ, 8-канальный набор ассоциативных), но E5 -4655 v3 имеет более высокую базовую частоту (2,9 ГГц против 2,4 ГГц) и вдвое больший объем кэша L3 (30 МБ 20-позиционного ассоциативного общего кэша против 15 МБ 20-позиционного ассоциативного общего кэша). За исключением разницы в базовой частоте, в различных рабочих нагрузках (включая виртуализацию Windows / Linux / FreeBSD, перекодирование видео, базы данных, сжатие / извлечение архивов и т. Д.), Было бы разумно увидеть разницу между этими процессорами в конфигурации с одним / двумя процессорами из-за Чем отличается кеш L3?

Я спрашиваю, потому что в настоящее время у меня есть сервер Dell R730 с двумя процессорами E5-4655 v3, и я рассматриваю возможность обновления процессора в не столь отдаленном будущем до одного процессора (мне действительно не нужны полосы PCIe или дополнительные объем памяти, предлагаемый вторым процессором, и я хотел бы сократить энергопотребление и потенциальные потери производительности, присущие системе 2S). Цены на бывшие в употреблении процессоры 2S обычно немного ниже, чем цены на процессоры 4S с аналогичными характеристиками (количество ядер / потоков, базовые / повышающие тактовые частоты), но мне интересно, какое влияние окажет уменьшение вдвое кеша L3. Имейте в виду, что если бы я объединил 2 процессора в 1, я бы не стал покупать упомянутый выше E5-2620 v3 (это было только для иллюстративных целей); Я бы получил> = 12 основных частей (пока не определился).

Я понимаю, что на этот вопрос может быть непросто дать конкретный ответ, но я был бы признателен за любые вводные или соответствующие контрольные данные. Спасибо.

Я понимаю, что на этот вопрос может быть непросто дать конкретный ответ, но я был бы признателен за любые вводные или соответствующие контрольные данные.

Зависит, тем более что вы описали разнообразную и разнообразную рабочую нагрузку. Невозможно узнать подробности, кроме тестирования вашей рабочей нагрузки. Тесты могут определять относительную производительность одного объекта, но производительность - это более сложный вопрос.

В целом, конечно, лучше новая микроархитектура, больше ядер, выше тактовая частота и больше кеша. Но у вас есть дополнительные ограничения, такие как мощность и стоимость.

Упомянутым вами Haswell уже несколько поколений. Часто это старое не стоит потребляемой энергии и вызывает беспокойство по поводу оставшейся продолжительности поддержки. Если вы ищете бывшие в употреблении или со скидкой, попробуйте одно поколение передовых технологий.

Система с четырьмя сокетами только для одного сокета, и ее кеш-память кажется сомнительной, пока Intel поддерживает сильно сегментированную линейку продуктов с премиальными функциями. Не самый извращенный стимул для экономики ЦП, возможно, имеет смысл. Но это довольно искажено только потому, что больше кеша выглядит заманчиво, нужны некоторые данные для поддержки такого решения.

Также подумайте, хотите ли вы оценивать других поставщиков. У AMD EPYC простая история с одним сокетом. Например, 16-ядерный EPYC 7302P имеет 128 МБ L3, как и EPYC 7302 с двумя сокетами. Это не тот используемый Xeon, который вы просили, но он может обеспечить ценовую конкуренцию. AMD определенно хочет продавать однопроцессорные системы.

Предпосылка вопроса - что Xeon E5 4xxx всегда имеет больше кэша L3, чем Xeon E5 2xxx - не всегда верна. Возьмем, к примеру, Xeon 2690v3: он имеет 30 МБ кеш-памяти L3, хотя и является процессором 2S.

Тем не менее, влияние уменьшения вдвое кеша L3 на ЦП на базе Broadwell будет полностью зависеть от рабочей нагрузки, которую ваше приложение возлагает на процессор: перекодирование или другие тяжелые задачи FPU будут практически не затронуты, в то время как виртуализация и базы данных могут показать попадание 5-15% (при тех же частотах / ядрах).

Однако основная причина, по которой процессоры 4S часто имеют больше кэша L3 на ядро, заключается в том, что они используют более сложную схему NUMA, где добавленный кеш означает меньшую задержку доступа к основной памяти. Более того, системы 4S могут использовать значительную часть LLC (в данном случае L3) для каталогов / отслеживания / согласованности, «тратя впустую» больше кеша, чем система 2S (но это сильно зависит от процессора и архитектуры системы).

Для будущего обновления бывших в употреблении запчастей просто купите то, что обеспечит вам лучший ремешок за свои деньги. Если переход на большой ЦП L3 стоит дорого, просто избегайте этого (возможно, вкладывая средства в дополнительные тактовые частоты / ядра).