Назад | Перейти на главную страницу

SGE для одного графического процессора CUDA с несколькими заданиями

Некоторое время я использую систему SGE (8.1.9), которая отлично справляется с планированием заданий ЦП. У меня есть машина с 14 процессорами и 1 графическим процессором, на которой запущен сервер Ubuntu 18.04. Я хотел бы включить графический процессор в систему планирования. Я следовал инструкциям Вот, и настроили датчик нагрузки nvidia-smi, сложный ресурс и определили gpu = 1 для моего хоста.

Моя проблема в том, что с этой системой я не могу отправлять сразу несколько вакансий. Когда я отправляю две работы с -l gpu=1 flag, оба выполняются немедленно, предположительно потому, что в этот момент значение gpu от датчика нагрузки читается как «1». Однако графический процессор может выполнять только одно задание, поэтому одно из двух не работает. Итак, мой вопрос: как я могу отправить несколько заданий одновременно с помощью этой системы? Обратите внимание, что установка команды сна работает, но работает только частично (только когда в очереди находится одно другое задание, и у меня может быть> 3 заданий в очереди).