У нас есть внутренний сервер мобильного приложения, использующий автоматическое масштабирование Elastic Beanstalk с 4 экземплярами t2.small.
Когда мы отправляем push-уведомления, это вызывает резкий кратковременный всплеск трафика на серверы. Поскольку автоматическое масштабирование занимает ~ 3 минуты, это бесполезно.
Как мы можем уменьшить задержку во время этих всплесков, не теряя при этом излишнего расхода ресурсов ЦП / долларов при меньшем времени трафика?
Не думаю, что на автоматическое масштабирование можно положиться. У AWS есть страница на ручное масштабирование которую вам следует прочитать.
Вы могли бы использовать масштабирование расписания, настройте масштаб до того, как ваши уведомления исчезнут.
Вы можете просто запустить больше серверов вручную, добавить их в балансировщик нагрузки и остановить их вручную, когда они больше не нужны. Это можно сделать с помощью консоли или с помощью скрипта, вызывающего API.
Вы можете изменить минимальный размер группы с помощью консоли или API перед отправкой уведомления.