Проблема с моей конфигурацией OGE. Load_avg для узлов не устанавливается (остается -NA-). Из-за этого и из-за порога np_load_avg в очереди никакие задания не выполняются.
[ce@node1 ce]$ qhost -F -l h=node2
HOSTNAME ARCH NCPU LOAD MEMTOT MEMUSE SWAPTO SWAPUS
-------------------------------------------------------------------------------
node2 - - - - - - -
Ошибки не появляются ни в default / spool / localhost / messages, ни в qmaster / messages. Сообщение планирования очереди - «нет значения для сложного атрибута np_load_avg».
Я не вижу никаких указаний на то, что может пойти не так, на исполнительном узле работает следующее:
Проблема была в моем файле / etc / hosts, у меня было:
127.0.0.1 node2
это должно было стать:
10.0.0.2 node2
Наконец давая мне
[ce@node1 ce]$ qhost -F -l h=node2
HOSTNAME ARCH NCPU LOAD MEMTOT MEMUSE SWAPTO SWAPUS
-------------------------------------------------------------------------------
node2 linux-x64 8 0.00 31.3G 308.8M 11.9G 0.0
и
[ce@node2 ce]# utilbin/linux-x64/gethostname
Hostname: node2
Aliases:
Host Address(es): 10.0.0.2