С участием gridengine-master
6.2u5-7.3 (Ubuntu Trusty), наш /var/lib/gridengine/spool/qmaster/messages
постоянно наполняется:
12/07/2016 04:11:43|worker|tools-grid-master|E|got load report of unknown exec host "tools-exec-1204.eqiad.wmflabs"
(tools-exec-1204.eqiad.wmflabs
хост, которого больше не существует.)
Как я могу убедить мастера сетки «двигаться дальше», т.е. е. «принять», что он действительно получил отчет о загрузке с неизвестного хоста, или «удалить» отчет о загрузке из своего почтового ящика?
По-видимому, проблема заключалась в том, что хост был отключен и удален из DNS, но все еще упоминался в host_aliases
. Удаление записи для хоста из host_aliases
и перезапускаем мастер сетки, чтобы перечитать host_aliases
(service gridengine-master restart
) вызвал остановку ошибок.