slurm – список вопросов по тегу – страница №1
я бегу systemctl start slurmd.service, и время ожидания истекает: Job for slurmd.service failed because a timeout was exceeded...
Кому-нибудь повезло с рандомизацией распределения узлов Slurm? У нас есть небольшой кластер из 12 узлов, который может использовать от 1 до 8 человек одновременно с заданиями...
Я только что настроил slurm, где одна физическая машина будет единственной системой в кластере (пока). Это на Ubuntu 18.04. У меня работает slurmdbd, но когда я пытаюсь...
Я пытался установить slurmdbd для учета на Ubuntu 16.04 из стандартных репозиториев (версия: 15.08.7-1build1). Вот команды: $ sudo apt-get install mysql-server...
У меня есть уже работающий кластер slurm, но на сегодняшний день без изменения конфигурации я получаю сообщение об ошибке при запуске определенных sacctmgr команды и slurmdbd...
Контролирует ли кластер SLURM, поддерживает или обеспечивает согласованность кэша между узлами? Это свойство конфигурации или чего-то подобного не существует? Я ничего не могу...
Меня попросили обновить установку Slurm Workload Manager. У меня есть slurm 2.3.4 на кластере Wheezy Debian 7.0 (1 мастер + 8 узлов). Я не установил его, поэтому я немного не...
У меня есть установка SLURM на одном узле, который также является "узлом входа". Я хотел бы ограничить интерактивное использование ЦП, например вне системы расписания. Я нашел...
У меня есть работа SLURM, с которой я отправляюсь sbatch, Такие как sbatch --gres gpu:Tesla-V100:1 job.sh...
В настоящее время у меня есть кластер из 10 рабочих узлов под управлением Slurm с 1 главным узлом. Я ранее успешно настраивал кластер после некоторых первых проблем, но мне...