Я использую Ubuntu 10.04 и пытаюсь установить Sun Grid Engine из репозитория Ubuntu. Он работает на одной машине, я могу отправлять задания и т. Д. Но я не могу заставить его работать с какой-либо другой машиной. Я добавил еще один исполняющий хост и установил gridengine-client gridengine-common gridengine-exec
но как-то не может общаться с хозяином. Я даже отключил все брандмауэры, чтобы убедиться, что это не вызывает проблем.
Когда я пытаюсь qstat -f
на главном узле я получаю:
queuename qtype resv/used/tot. load_avg arch states
---------------------------------------------------------------------------------
standard@neuron1 BIP 0/0/2 0.04 lx26-amd64
---------------------------------------------------------------------------------
standard@neuron2 BIP 0/0/2 -NA- -NA- au
Когда я перезапускаю демона на узле Neuron2, я получаю:
error: can't find connection
error: can't get configuration from qmaster -- backgrounding
Когда я пытаюсь бежать qstat -f
от узла n2 (нейрон2) я получаю:
error: commlib error: access denied (server host resolves destination host "n1" as "neuron1")
error: unable to contact qmaster using port 6444 on host "n1"
У меня есть два имени хоста для этой машины, и похоже, что первая ошибка как-то связана с этим, но было бы странно, если бы она вызывала такого рода проблемы. Я попытался telnet n1 6444
и он соединяется.
Кто-нибудь знает, что здесь происходит? Я что-то упускаю?
Хорошо, проблема действительно была в двойных именах хостов. Когда я снял один, он заработал. Я покопаюсь и попытаюсь понять, почему это так.