Я изучаю, могут ли сервисы облачных вычислений (например, AWS, а также другие) реально дополнить традиционные кластеры (такие как Comet, Stampede2, Pleiades), которые я использовал для решения задач гидродинамики.
То есть мне нужно запустить свой код (не OpenFOAM, который AWS рекламирует в одном из своих планов), и ему потребуется ~ 1 ТБ RAM ~ 360 процессоров, которые имеют быстрое соединение (и находятся в том же месте, чтобы минимизировать задержку).
Более общий вопрос: означает ли облачные вычисления, что все виртуализировано на какой-то неизвестной, возможно, небольшой машине, или можно запросить использование определенного оборудования с помощью облачных вычислений (где в данном случае оно используется так же, как и традиционные кластер, но процесс распределения может быть совсем другим)?
Из больших общественных облаков, AWS и Лазурь утверждают, что у них есть решения для подключения экземпляров к сети с малой задержкой. Приложения, как обычно, имеют реализацию MPI.
В некоторых случаях вы можете повлиять на более близкое размещение экземпляра, например, с помощью Группы размещения AWS в кластерной стратегии. Они не собираются говорить ни о чем, но, по-видимому, это не стойки, предназначенные для высокопроизводительных вычислений. Просто стойки с самыми быстрыми сетевые карты с аппаратным и программным ускорением, с одним арендатором или выделенными металлическими узлами.
Или, если приложение может масштабироваться в большой системе NUMA, также учтите это. NUMA по-прежнему имеет задержки между узлами, но достаточно низкие для запуска одного образа.
Для x86 на последних процессорах Xeon с 2019 года доступно восемь сокетов с общим числом ядер 224. Для большего количества сокетов требуются специальные межсоединения, которые встречаются только на редких устройствах, таких как HPE Superdome Flex Server. Первый доступен как инстанс AWS с высокой памятью, второй вряд ли будет доступен для аренды в облаке.
Для POWER существуют системы с 16 сокетами, такие как E980, в стандартных конфигурациях, но с меньшим количеством ядер.
AWS предлагает высокая память конфигурации из чистого металла, предназначенные для работы БД HANA (БД в оперативной памяти), и на момент написания этой статьи наименьшая из них начиналась с 6 ТБ ОЗУ и имела 224 ядра, в общей сложности 448 логических процессоров.
Если это не удовлетворяет ваши потребности, вам придется отправиться в другое место, например Virtustream (компания Dell Technologies), которая обслуживает критически важные облачные системы.
Отказ от ответственности: Я работаю в Virtustream ... ¯ \ _ (ツ) _ / ¯