Назад | Перейти на главную страницу

Сигналы тревоги AWS в состоянии «ТРЕВОГА» не запускают действия политики

Сегодня я создал группу AutoScaling с несколькими политиками, каждая из которых имеет сигнал тревоги, связанный с метрикой CloudWatch. Группа AutoScaling запустила два экземпляра, потому что это минимум, который мне требовался для этой группы. Я включил тесты производительности, чтобы попасть в новую группу, и их совокупное среднее значение CPUUtilization поднялось выше пороговых значений, которые я установил для сигналов тревоги. Я просматривал историю каждого из этих сигналов тревоги, когда состояние менялось с INSUFFICIENT_DATA, затем на OK и, наконец, на ALARM. Как и ожидалось. Затем я дождался выполнения Политики. Указанные 300 секунд до исполнения пришли и ушли. Затем я решил посмотреть, сколько времени потребуется, прежде чем политики будут выполнены. Прошло уже более полутора часов, а эти Политики еще не реализованы.

Я был разочарован и удалил ASG и все политики и предупреждения. Я решил, что, возможно, я допустил ошибку при создании политик и предупреждений. Я воссоздал их все. Та же проблема. Сигналы тревоги находятся в состоянии СИГНАЛИЗАЦИИ и никогда не выполняют Политики. Я могу без проблем выполнять политики вручную, но это неважно.

Если это имеет значение, я создал все это в Консоли AWS. В прошлом я использовал API для создания ASG и политик, и эти группы прекрасно выполняли политики.

Что-то я делаю не так? (Или, возможно, у сервисов AWS просто проблемы.)

ОБНОВИТЬ:

Попробовал сегодня снова. Решил использовать API вместо консоли, чтобы посмотреть, есть ли разница. Будильник, который я использую, обновился с OK на ALARM 20 минут назад.

CPUUtilization >= 35 for 5 minutes
Actions: In ALARM: For group TEST use policy Scale Out API (Add 1 instance)
Namespace: AWS/EC2
Metric Name: CPUUtilization
Dimensions: AutoScalingGroupName = TEST
Statistic: Average
Period: 5 minutes

2013-12-19 15:13 UTC-7 - Обновление состояния - Тревога обновлена ​​с OK на ALARM

Текущее время: 15:43 UTC-7 (30 минут после будильника)

Действие не сработало. Есть идеи, почему?

Я задал этот вопрос на Форумы Amazon и, по-видимому, есть недавняя ошибка в создании Alarms, которая автоматически устанавливает для свойства "ActionsEnabled" значение False.

Из AWS:

We have identified an issue in the AutoScaling console regarding the binding of
AutoScaling policies to CloudWatch alarms and are working on a fix. We will post
an update to this thread once the fix is rolled out. Thanks for bringing this to
our attention.

Обходной путь на данный момент:

In the meantime, please try calling the DescribeAlarms CloudWatch API. If the
alarms associated with your policies have ActionsEnabled=false, then this could
cause your policies to not be invoked when the alarm is triggered. Please try
calling the PutMetricAlarm CloudWatch API to update ActionsEnabled=true for the
affected alarms, and that should fix the issues you are experiencing.

Я подтвердил ошибку и способ ее решения своими собственными сигналами тревоги через API.