Я столкнулся с ситуацией, когда вся моя служба перестала отвечать из-за небольшого объема трафика при использовании сред Flex.
У меня есть учетная запись Google Cloud с двумя службами, работающими в App Engine ПО УМОЛЧАНИЮ и ВТОРИЧНЫМ. Оба они содержат один и тот же код (API Flask v1x).
По умолчанию используется для обслуживания данных пользователя в нашем приложении Angular. 2 экземпляра, 2 процессора по 4 ГБ
Вторичный используется для обработки длинных задач, выполнение которых занимает от 10 до 60 секунд, таких как выборка данных из стороннего API. 2 экземпляра, 4 процессора, 8 ГБ оперативной памяти.
Я использую Cloud Tasks для постановки запросов на ВТОРИЧНЫЙ сервер.
На своем компьютере я могу обрабатывать 100–150 задач в минуту.
Когда я отправляю более 20-30 задач одновременно на вторичный сервер, он обрабатывает только 5-10 задач в минуту и ... он вылетает. Не только вторичный, но и сервер по умолчанию также перестает отвечать.
Я думал, что это узкое место в базе данных, но это не так. Мой локальный компьютер одновременно обращается к той же базе данных без проблем, и весь мониторинг выглядит нормально.
Итак .. есть идеи, в чем может быть проблема? Почему второстепенные задачи влияют на значение по умолчанию? Почему движок приложений не может обрабатывать более 100 запросов, как мой компьютер?