Назад | Перейти на главную страницу

Архитектура Nvidia Pascal: размер DMA / максимальный объем оперативной памяти хост-системы?

Мы планируем построить пару серверов Linux с несколькими GPU для задач машинного обучения и анализа данных. Согласно нашим требованиям, нам нужно разместить на этих машинах много оперативной памяти; мы планируем установить 24 модуля LRDIMM емкостью 64 ГБ на общую сумму 1,5 ТиБ. Для графических процессоров мы собирались использовать Titan X, чтобы получить максимальную отдачу от вложенных средств, но, согласно Документация по драйверам для Linux от Nvidiaкарты текущего поколения не могут обрабатывать более 1 ТБ ОЗУ хост-системы. Я слышал «слухи» о том, что архитектура Pascal будет иметь расширенные возможности адресации, но я не могу найти никакой надежной документации, подтверждающей или опровергающей это. Если это окажется правдой, мы можем использовать более новые карты GTX 1080, даже если у них на графической карте меньше ОЗУ на 4 ГБ.

Отсюда мой вопрос: есть ли какая-то документация о возможностях адресации Паскаля, которую мне не хватает?

Или, альтернативно, может ли кто-нибудь, имеющий доступ к GTX 1080, запустить
grep DMA /proc/driver/nvidia/gpus/domain:bus:device.function/information для меня?

Отвечая на свой вопрос для использования в будущем. Мы решили использовать карты GTX 1080. Под версией драйвера 367.57, они сообщают о следующих возможностях DMA:

$ grep DMA /proc/driver/nvidia/gpus/0000\:04\:00.0/information
DMA Size:    47 bits
DMA Mask:    0x7fffffffffff

Таким образом, они должны иметь возможность адресовать до 140 терабайт ОЗУ хост-системы - более чем достаточно для нашего случая использования.