Назад |
Перейти на главную страницу
Как получить лучший результат LINPACK и покорить Top500?
Учитывая большой Кластер Linux HPC с сотнями / тысячами узлов. Что ваши лучшие практики чтобы получить самое лучшее Тест LINPACK (HPL) результат к Отправить для Список суперкомпьютеров Top500?
Чтобы дать вам представление о том, какие ответы я был бы признателен, вот несколько подвопросов (со ссылками):
- Как тебе настроить параметры (
N
, NB
, P
, Q
, выравнивание памяти и т. д.) для HPL.dat
файл (не тратя слишком много времени на попытки каждой возможной перестановки - особенно с проблемами большого размера N)? - Есть ли Top500 правила подачи быть в курсе? Что разрешено, а что нет?
- Который MPI продукт, какая версия? Есть ли разница?
- Любые специальные заказ хозяина в вашем машинном файле MPI?
- Ты используешь Закрепление процессора?
- Как настроить соединять? Какое межсоединение?
- Который BLAS пакет вы используете для какой модели процессора? (Intel MKL, AMD ACML, GotoBLAS2, и т.д.)
- Как ты подготовиться к большому пробегу (на всех узлах)? Начать с небольших запусков на подмножестве узлов, а затем увеличить масштаб? Действительно ли необходимо запускать LINPACK с большой пробег на всех узлах (или допускается экстраполяция)?
- Как вы оптимизируете для новейших процессоров Intel / AMD? Гиперпоточность? NUMA?
- Стоит ли перекомпилировать программный стек или ты используешь предварительно скомпилированные двоичные файлы? Какие настройки? Который компилятор оптимизации, какой компилятор? (А как насчет компиляции на основе профиля?)
- Как добиться наилучшего результата, имея только ограниченное количество времени выполнить тестовый запуск? (Вы можете заблокировать огромный кластер навсегда)
- Как ты подготовить отдельные узлы (остановка системных демонов, освобождение памяти и т. д.)?
- Как ты справляешься с аппаратные сбои (разрушая огромный пробег)?
- Есть ли обязательные к прочтению документы или веб-сайты по этой теме? Например. Я хотел бы услышать о некоторых фоновые истории о некоторых текущих системах Top500 и о том, как они выполнили свой тест LINPACK.
Я сознательно не хочу упомянуть конкретные детали оборудования или обсудить рекомендации по оборудованию, потому что я не хочу ограничивать ответы. Однако не стесняйтесь упоминать подсказки, например для конкретных моделей ЦП.
Попробуйте этот инструмент, он может вам помочь, он предлагает настроенные значения для некоторых критических параметров HPL и есть пошаговое руководство по запуску HPL на кластерах. Инструмент также оценивает ваше место в списке TOP500 в зависимости от характеристик вашей системы:
http://hpl-calculator.sourceforge.net
Надеюсь, вы сочтете это полезным.