Мы обновили наш кластер Kubernates Service в Azure до последней версии 1.12.4. После этого мы внезапно понимаем, что поды и узлы больше не могут связываться между собой по частному IP:
kubectl get pods -o wide -n kube-system -l component=kube-proxy
NAME READY STATUS RESTARTS AGE IP NODE
kube-proxy-bfhbw 1/1 Running 2 16h 10.0.4.4 aks-agentpool-16086733-1
kube-proxy-d7fj9 1/1 Running 2 16h 10.0.4.35 aks-agentpool-16086733-0
kube-proxy-j24th 1/1 Running 2 16h 10.0.4.97 aks-agentpool-16086733-3
kube-proxy-x7ffx 1/1 Running 2 16h 10.0.4.128 aks-agentpool-16086733-4
Как видите, узел aks-agentpool-16086733-0 имеет частный IP-адрес 10.0.4.35. Когда мы пытаемся проверить логи на подах, которые находятся на этом узле, мы получили такую ошибку: Get https: // aks-agentpool-16086733-0: 10250 / containerLogs / emw-sit / nginx-sit-deploy-864b7d7588-bw966 / nginx-sit? tailLines = 5000 & timestamps = true: dial tcp 10.0.4.35:10250: тайм-аут ввода / вывода
У нас есть румпель (Helm) на этом узле, и при попытке подключиться к румпелю мы получили такую ошибку с клиентского ПК:
shmits-imac:~ andris.shmits01$ helm version
Client: &version.Version{SemVer:"v2.12.3", GitCommit:"eecf22f77df5f65c823aacd2dbd30ae6c65f186e", GitTreeState:"clean"}
Error: forwarding ports: error upgrading connection: error dialing backend: dial tcp 10.0.4.35:10250: i/o timeout
Кто-нибудь знает, почему модули и узлы потеряли связь по частному IP?
Убедитесь, что значение Cluster ControlPlane SecurityGroup такое же, как до и после обновления. Изменение группы безопасности вызовет проблему связи между панелью управления и модулями.