Назад | Перейти на главную страницу

Как сделать так, чтобы мастер сетки «принимал» пропавшие хосты?

С участием gridengine-master 6.2u5-7.3 (Ubuntu Trusty), наш /var/lib/gridengine/spool/qmaster/messages постоянно наполняется:

12/07/2016 04:11:43|worker|tools-grid-master|E|got load report of unknown exec host "tools-exec-1204.eqiad.wmflabs"

(tools-exec-1204.eqiad.wmflabs хост, которого больше не существует.)

Как я могу убедить мастера сетки «двигаться дальше», т.е. е. «принять», что он действительно получил отчет о загрузке с неизвестного хоста, или «удалить» отчет о загрузке из своего почтового ящика?

По-видимому, проблема заключалась в том, что хост был отключен и удален из DNS, но все еще упоминался в host_aliases. Удаление записи для хоста из host_aliases и перезапускаем мастер сетки, чтобы перечитать host_aliases (service gridengine-master restart) вызвал остановку ошибок.