Сделал ошибку в конфигурации марионетки и непреднамеренно позволил марионетке обновить кластер Kubernetes до версии 1.13.0. Поскольку k8 хочет несколько сложного процесса обновления, все было довольно неудачно.
После запуска процесса вручную и получения всех затронутых узлов и освоения одной и той же версии кажется, что кубелет (и, следовательно, сервер api) будет работать в течение 20-30 минут, а затем перестанет отвечать.
По мере того, как он начинает становиться недовольным, в журнале появляется больше таких записей:
level = error msg = "Ошибка при запуске exec в контейнере: ошибка rpc: code = 2 desc = oci runtime error: exec failed: container_linux.go: 247: запуск процесса контейнера вызвал \" process_linux.go: 110: декодирование ошибки инициализации из канала вызвало \\ "чтение родителя: сброс соединения одноранговым узлом \\" \ "\ n"
и
file.go: 182] Не повторяется в пути манифеста "/ etc / kubernetes / manifest / <путь>"
с различными записями пространства имен для дорожка. Этот цикл повторяется каждые 20 секунд, пока kubelet не перестанет отвечать. Если я перезапускаю кубелет вручную, он некоторое время работает и начинает цикл заново.
Я что-то пропустил в процессе обновления?
[root@kube-master ~]# rpm -qa | grep docker
docker-client-1.13.1-84.git07f3374.el7.centos.x86_64
docker-1.13.1-84.git07f3374.el7.centos.x86_64
docker-common-1.13.1-84.git07f3374.el7.centos.x86_64
Первое сообщение об ошибке выглядит очень вероятным вот этот.
Может быть, вы можете проверить, работает ли на этих подключенных узлах докер последней версии?