У нас есть набор служб, развернутых на платформе google run, управляемой для веб-приложения, и всякий раз, когда нет трафика, кажется, что службы переходят в спящий режим, а затем требуется много времени, чтобы разбудить их всякий раз, когда приходит новый трафик. Есть ли способ сохранить хотя бы один экземпляр служб в рабочем состоянии без необходимости подделывать трафик, регулярно отправляя запросы этим контейнерам? Параметр отключен в пользовательском интерфейсе, а в командной строке, похоже, единственный доступный параметр - при запуске кластера anthos, который не полностью управляется: https://cloud.google.com/sdk/gcloud/reference/run/deploy#--min-instances
Мы используем следующую команду для развертывания наших сервисов:
Если ваш вопрос связан с управлением экземпляром в App Engine, вы можете использовать параметр ручного масштабирования. Масштабирование вручную определяет количество экземпляров, которые постоянно работают независимо от уровня нагрузки. Это позволяет выполнять такие задачи, как сложные инициализации и приложения, которые зависят от состояния памяти во времени. ссылка-1 для подробностей.
Если ваш вопрос связан с тем, как установить минимальную шкалу 1 для k-native в GKE? пожалуйста, смотрите подробности на ссылка-2