Почему мой экземпляр группы автомасштабирования неработоспособен?

Я заметил очень странную проблему с группой автоматического масштабирования AWS.

Об экземплярах сообщается (неправильно) как о нездоровых. Затем экземпляры прекращают работу и заменяют без необходимости. Это вызывает проблемы, поскольку пропускная способность ASG недостаточна для того, чтобы справиться с нагрузкой.

Чтобы попытаться определить проблему, я временно приостановил процесс «Завершить» для ASG.

На данный момент у меня есть единственный экземпляр в группе, который, по мнению ASG, является нездоровым. Вход в экземпляр и тестирование проверки работоспособности напрямую доказывает, что он действительно исправен.

Кроме того, балансировщики нагрузки, связанные с ASG, также сообщают обо всех экземплярах как о работоспособных.

У меня такой вопрос. Как моя ASG может считать экземпляр «НЕЗДОРОВНЫМ», если тип проверки работоспособности для группы установлен на «ELB», а балансировщики нагрузки сообщают, что экземпляр исправен?

Есть ли способ узнать, когда и почему ASG пометила экземпляры как «Неработоспособные»?

Эта ASG в настоящее время связана с двумя классическими ELB и двумя целевыми группами ALB. Мы находимся в процессе перехода с ELB на ALB.

Как уже упоминалось, как ELB, так и обе целевые группы сообщают обо всех экземплярах как о работоспособных.

Я предполагаю, что проблемы возникают из-за наличия экземпляра части нескольких ELB / ALB TG. Я подозреваю, что любой из этих ELB / ALB может затем вызвать завершение работы экземпляра, если по какой-либо причине сочтет это нездоровым.

Изменить проверка здоровья введите в EC2 пока вы не закончите миграцию.

В лучшая практика должна привязать ASG только к единый балансировщик нагрузки.

Надеюсь, это поможет :)