Назад | Перейти на главную страницу

Dell PowerEdge T-620 - выбор режимов памяти в BIOS

Я пытаюсь настроить Memory Modeв BIOS Dell PowerEdge T620 с двумя процессорами: Инструкция по применению | Техническое руководство

В системе установлено 384 ГБ памяти DDR3 LRDIMM, и я могу выбрать любой из следующих режимов:

  1. Режим оптимизатора
  2. Запасной режим
  3. Зеркальный режим
  4. Расширенный режим ECC
  5. Запасной с Advanced ECC
  6. Режим отказоустойчивости Dell

В дополнение к этому, поскольку все модули DIMM идентичны, конфигурация памяти позволяет мне установить Node Interleaving на «включено» или «отключено» со следующим описанием чередования узлов:

Если в системе настроена соответствующая память, это поле включает чередование узлов. Если установлено значение Disabled (по умолчанию), система поддерживает конфигурации памяти с неоднородной архитектурой памяти (NUMA) (асимметричные). Это поле активно, только если конфигурация памяти поддерживает чередование.

Эта система будет работать Proxmox для размещения виртуальных машин.

Какой режим вы бы выбрали и почему? Включите ли вы чередование узлов и почему?

Я предпочитаю Advanced ECC. Оптимизированный режим поддерживает коррекцию данных на одном устройстве (SDDC) только для модулей памяти, которые используют ширину устройства x4. Он не предъявляет никаких особых требований к заполнению слотов. Режим расширенного кода коррекции ошибок (ECC) расширяет возможности SDDC от модулей DIMM на базе DRAM x4 до модулей DRAM x4 и x8. Это защищает от отказов одного чипа DRAM во время нормальной работы. Ограничение состоит в том, что модули памяти должны быть одинаковыми по размеру, скорости и технологии. Идентичные модули DIMM устанавливаются в согласованную пару. Поскольку вы можете заказать сервер с самого начала с этим типом соответствия модуля, нет проблем с использованием AECC вместо оптимизированного.

Обратите внимание, что как оптимизированный режим, так и режим AECC позволяют полный объем памяти быть пригодным для использования.

Если с питанием все в порядке, каким оно должно быть на сервере, то у модулей ОЗУ нет реальной причины, вероятность этого мала.

Если вы хотите убедиться, что вам не нужно открывать сервер в случае маловероятного сбоя памяти, вы можете выбрать резервный режим. В этом режиме один ранг на канал зарезервирован как резервный. Если в ранге обнаруживаются устойчивые исправимые ошибки, данные из этого ранга копируются в резервный ранг, а ранг с ошибкой отключается. Объем памяти, доступный операционной системе, уменьшается на один ранг на канал.

Например, в двухпроцессорной конфигурации с 16 модулями одноранговой памяти по 4 ГБ доступная системная память составляет: 3/4 (ряды / канал) × 16 (модули памяти) × 4 ГБ = 48 ГБ, а не 16 1x (модули памяти) × 4 ГБ = 64 ГБ.

Зеркалирование похоже на RAID 1 для памяти. Плохо то, что в зеркальной конфигурации общая доступная системная память составляет половину общей установленной физической памяти, точно так же, как с жесткими дисками в RAID 1. Так что, если вам действительно нужна максимальная защита, вы можете выбрать эту, но в вашем случае вы будет всего 192 ГБ (половина) работать с.

Отказоустойчивая память (FRM) - это рабочий режим, представленный в новых серверах PowerEdge. В этом режиме создается область памяти, которая устойчива к сбоям и может использоваться гипервизорами, такими как VMware ESXi, для загрузки vmkernel, критических приложений или служб, чтобы максимизировать доступность системы. Операционные системы используют отказоустойчивую область, предоставляемую платформой, и сопоставляют диапазоны адресов процесса, чтобы обеспечить отказоустойчивость. Это хорошо для установок ESXi. FRM создает очень устойчивую зону памяти для гипервизора, защищая его от серьезных ошибок памяти. Благодаря функции надежной памяти VMware vSphere 5.5 и более поздних версий могут использовать преимущества этой зоны, обеспечивая гипервизору надежную защиту от сбоев памяти, которые могут вывести из строя всю систему.

из мелланокса

Чередование узлов - когда чередование узлов отключено, включен режим NUMA. И наоборот, включение чередования узлов означает, что память перемежается между узлами памяти и в операционной системе отсутствует представление NUMA. По соображениям производительности мы хотим отключить чередование (и включить NUMA), чтобы гарантировать, что память всегда выделяется локальному узлу NUMA для любого данного логического процессора.

Попытка описать происходящее:

  • В простейшем случае у вас есть один процессор и два (или четыре) слота DIMM. Контроллер памяти теперь находится внутри ЦП, поэтому в идеале, когда ядру в данном ЦП нужны данные из ОЗУ, вы хотите, чтобы оно извлекало их из ближайшего ОЗУ - из контроллера памяти в ближайший слот DIMM. В этом сценарии с одним процессором беспокоиться не о чем.
  • у вас есть два (или более) ЦП, два (или более) разных контроллера памяти, но они могут получить доступ к ОЗУ через другой контроллер памяти ЦП, чтобы добраться до его DIMM и получить доступ к 500+ ГБ общей оперативной памяти или тому, что у вас может быть. Ну так что ты делаешь...
    • есть два способа сделать это (я думаю). Простой способ, просто чередовать и всегда обращаться к DIMMS любого другого процессора, но со штрафом: в игру вступают тайминги памяти, и поэтому вы всегда просто используете самое медленное (самое длинное) время доступа как одно и то же время доступа для всего. В противном случае вы были бы ограничены общим объемом оперативной памяти = только тем, что доступно для одного процессора, а не для 2, 4 или 8 процессоров. Таким образом, при доступе к локальной оперативной памяти через локальные диммы к контроллеру памяти процессора, где находится процесс, это могло быть быстро, но теперь (долгое) время, основанное на доступе к самому дальнему DIMM, так что вся оперативная память может отображаться как общая память . Я считаю, что именно поэтому interleaved = снижение производительности. NUMA = доступ к неоднородной памяти. Поскольку доступ к памяти может быть как бы далеким, тайминги по своей сути будут разными и неоднородный. Но контроллеры памяти BIOS / EFI и ЦП могут справиться со всем этим через модель NUMA. Вот почему все теперь NUMA. Я почти уверен, что вам не нужно чередование; не используйте чередование, если вы не получили инструкции из надежного источника использовать его по определенной причине, которая требует этого. Мне было бы интересно услышать о такой причине, если бы кто-нибудь о ней знал.

Это факт, что память с ECC работает медленнее, чем обычная оперативная память для настольных компьютеров, не относящаяся к ECC, потому что она должна выполнять проверку ошибок. но не вырывайте это из контекста. если вы цените надежность и надежность, то, вероятно, используйте расширенный режим ECC. Но если ваша цель - максимальная производительность, тогда расширенный (или любой) режим ECC может быть не идеальным, и я подозреваю, что лучшим выбором будет режим оптимизатора №1 для вашего конкретного устройства ... Мне нужно было бы прочитать определение Dell там предложений меню.