Назад | Перейти на главную страницу

MAAS (2.4.2) не загружает все образы (включая временные)

Я использую MAAS 2.4.2 для администрирования кластера компьютеров на работе. Вчера мне пришлось перезагрузить узел (уже развернутый), чтобы исправить проблему с драйвером. Он больше не вернулся. Я смог ввести IPMI в машину, чтобы проверить это, и обнаружил, что он застрял в процессе загрузки. Я безуспешно пытался перезагрузиться. Думая, что это связано с чем-то, что я сделал с драйверами, я попытался войти в режим восстановления MAAS. Однако при загрузке временного аварийного образа запуск застрял на том же месте. По прихоти я попытался выпустить и повторно развернуть машину: то же самое, эфемерный образ, используемый для развертывания, начинает нормально загружаться, а затем застревает. Вот как выглядит компьютер при попытке развернуть:

Мне кажется, что у узла проблемы с ответом на сервер MAAS, и он застревает там. Я не знаю, должно ли это привести к зависанию загрузки на неопределенное время, но если вы заметили на скриншоте, есть много шагов, которые не имеют [ OK ] рядом с ними, и они, как правило, связаны с сетью.

Интересно, что поскольку мое развертывание не удалось, операционная система, которая была установлена ​​на SDD компьютера до того, как начался весь этот беспорядок, все еще существует. Если я пропущу загрузку PXE при запуске и загрузлюсь сразу с SDD, я смогу получить доступ к режиму восстановления Ubuntu. Я могу призвать /etc/init.d/networking start вручную и я делать получить исправное сетевое подключение + DNS и все такое. Дело в том, что сеть кажется исправной на узле, поэтому, если моя теория о том, что узел не может общаться с MAAS, верна, это означает, что сам MAAS не коммуникативен.

Я очень застрял здесь, поэтому любые идеи были бы потрясающими.

Спасибо!

Прочитав некоторые журналы MAAS и не увидев ничего особенно тревожного, я решил просто перезапустить две службы контроллера MAAS: maas-regiond и maas-rackd. Сейчас все работает безупречно, как и раньше.