Назад | Перейти на главную страницу

Планируется только половина моих заданий pbs / Torque

Мой суперкомпьютерный центр недавно перешел с SGE на pbs / Torque. Теперь, когда я планирую свои задания массива, расписывается только половина заданий в массиве. Когда они закончат, другая половина будет расписана. Это происходит несмотря на то, что они в значительной степени недоиспользуются.

Например, я только что запланировал массив с 10 заданиями. Вот результат qstat через 10 минут:

[myuserna@sub ~]$ qstat -t
Job id                    Name             User            Time Use S Queue
------------------------- ---------------- --------------- -------- - -----
3100[1].systemm2           ...-to-work.sh-1 myuserna        00:07:40 R short          
3100[2].systemm2           ...-to-work.sh-2 myuserna        00:07:32 R short          
3100[3].systemm2           ...-to-work.sh-3 myuserna        00:09:55 R short          
3100[4].systemm2           ...-to-work.sh-4 myuserna        00:09:44 R short          
3100[5].systemm2           ...-to-work.sh-5 myuserna        00:09:07 R short          
3100[6].systemm2           ...-to-work.sh-6 myuserna               0 Q short          
3100[7].systemm2           ...-to-work.sh-7 myuserna               0 Q short          
3100[8].systemm2           ...-to-work.sh-8 myuserna               0 Q short          
3100[9].systemm2           ...-to-work.sh-9 myuserna               0 Q short          
3100[10].systemm2          ...to-work.sh-10 myuserna               0 Q short          
[myuserna@sub ~]$ 

Есть подсказки, как исправить планировщик?

Вот соответствующая часть конфигурации планировщика:

create queue short
set queue short queue_type = Execution
set queue short Priority = 10000
set queue short max_user_queuable = 500
set queue short max_running = 200
set queue short resources_max.walltime = 24:00:00
set queue short resources_default.nodes = 1
set queue short max_user_run = 50
set queue short enabled = True
set queue short started = True
#

#
# Set server attributes.
#
set server scheduling = True
set server acl_hosts = systemm2
set server acl_roots = root@*
set server managers = root@systemm2.local
set server operators = root@systemm2.local
set server default_queue = route
set server log_events = 511
set server mail_from = adm
set server resources_default.walltime = 01:00:00
set server scheduler_iteration = 600
set server node_check_rate = 150
set server tcp_timeout = 6
set server mom_job_sync = True
set server keep_completed = 300
set server submit_hosts = submit-1
set server submit_hosts += submit-0
set server auto_node_np = True
set server next_job_number = 6217
set server max_job_array_size = 512
set server max_slot_limit = 5

Обратитесь к администратору. Можно ограничить количество используемых слотов для каждого пользователя в очереди.

Обновление: хорошо, теперь вы обновили вопрос, чтобы показать

set server max_slot_limit = 5

который, я уверен, отвечает на вопрос.