У меня есть приложение, состоящее из ~ 40 контейнеров докеров, от NoSQL, СУБД, приложений C, приложений Go, Python и т. Д., Организованных с использованием Kubernetes
, Все работает на GCP
. С помощью GLB (Load Balancer) во внешнем интерфейсе.
Теперь, если я создам много реплик и выделю этим приложениям много ресурсов, все будет работать правильно. Но если я даю достаточно ресурсов, то интерфейс иногда загружается очень медленно, веб-приложение какое-то время перестает отвечать, а затем загадочным образом снова возвращается.
Все это происходит без выселения или перезапуска модулей.
Когда это происходит, я вижу, что ЦП / память на 50%, поэтому ресурсы не исчерпаны.
Как приступить к отладке, в чем причина медлительности? Как мне откалибровать, какое приложение требует столько ресурсов?
Вы можете изучить трассировку или что-то вроде Istio, оба из которых дадут вам лучшую телеметрию о том, кто с кем разговаривает, задержку между ними и т. Д.