у меня есть Angular
, NodeJS
и nginx
работает на 2-ядерном экземпляре 8GB RAM Ubuntu 18.04 на google compute engine
. Сервер работал нормально (жесткий диск 49%, ЦП ниже 10% и ОЗУ ниже 40%), но внезапно веб-интерфейс не работал (например, сервер был остановлен). В то время я проверил облачную консоль Google, и система работала нормально. Затем я попытался ssh
с помощью WinSCP
но не смог подключиться к хосту. Затем я попробовал использовать web ssh на веб-сайте облачной консоли, но это тоже не так. Я перезапустил сервер, все было нормально.
Я проверил все журналы моей базы данных и сервера узлов, сервер работал все время без проблем. Я пришел к выводу, что ОС работала все время.
Я использовал мониторинг в консоли Google, процессор работал, но нет сетевая активность за указанный период (входящая / исходящая)
Любое объяснение вышеуказанного сценария? Должен ли я устранять неполадки на сервере или в Google?
Какие шаги я могу предпринять, чтобы определить проблемы в вышеуказанных сценариях? Какие журналы мне следует проверить?
Кроме того, есть ли какие-либо журналы из консоли Google, которые я могу проверить для устранения неполадок?
Так как @AdolfoOG упомянуто - вы должны проверить журналы, чтобы решить эту проблему.
Но когда это случилось, вы не смогли подключиться к вашей машине по SSH. Даже если вы не можете, вы все равно можете проверить последовательный вывод консоли через графический интерфейс консоли или gcloud compute instances get-serial-port-output instance_name --zone=my_zone
в Cloud Shell.
Чтобы иметь возможность войти в систему [разрешить взаимодействие с последовательной консолью] [4] gcloud compute instances add-metadata instance-name --metadata serial-port-enable=TRUE
и подключитесь к нему с помощью gcloud compute connect-to-serial-port instance-name
.
Теперь, когда вы вошли в систему, вы можете проверить все журналы или службы, если проблема не исчезнет.
Что касается описания вашей проблемы, я могу только подумать, что агент Google перезапустил сетевые службы и по какой-то причине не смог их запустить должным образом. Обычно это можно подтвердить только внутри ОС, проверив, что агент запущен, или проверив журналы агента, однако обычно в журнале Stackdriver есть общее сообщение, в котором говорится: «Конфигурация агента ОС запущена». Когда экземпляр был перезапущен, агент снова запустил конфигурацию.