Я заметил очень странную проблему с группой автоматического масштабирования AWS.
Об экземплярах сообщается (неправильно) как о нездоровых. Затем экземпляры прекращают работу и заменяют без необходимости. Это вызывает проблемы, поскольку пропускная способность ASG недостаточна для того, чтобы справиться с нагрузкой.
Чтобы попытаться определить проблему, я временно приостановил процесс «Завершить» для ASG.
На данный момент у меня есть единственный экземпляр в группе, который, по мнению ASG, является нездоровым. Вход в экземпляр и тестирование проверки работоспособности напрямую доказывает, что он действительно исправен.
Кроме того, балансировщики нагрузки, связанные с ASG, также сообщают обо всех экземплярах как о работоспособных.
У меня такой вопрос. Как моя ASG может считать экземпляр «НЕЗДОРОВНЫМ», если тип проверки работоспособности для группы установлен на «ELB», а балансировщики нагрузки сообщают, что экземпляр исправен?
Есть ли способ узнать, когда и почему ASG пометила экземпляры как «Неработоспособные»?
Эта ASG в настоящее время связана с двумя классическими ELB и двумя целевыми группами ALB. Мы находимся в процессе перехода с ELB на ALB.
Как уже упоминалось, как ELB, так и обе целевые группы сообщают обо всех экземплярах как о работоспособных.
Я предполагаю, что проблемы возникают из-за наличия экземпляра части нескольких ELB / ALB TG. Я подозреваю, что любой из этих ELB / ALB может затем вызвать завершение работы экземпляра, если по какой-либо причине сочтет это нездоровым.
Изменить проверка здоровья введите в EC2 пока вы не закончите миграцию.
В лучшая практика должна привязать ASG только к единый балансировщик нагрузки.
Надеюсь, это поможет :)