Сегодня я создал группу AutoScaling с несколькими политиками, каждая из которых имеет сигнал тревоги, связанный с метрикой CloudWatch. Группа AutoScaling запустила два экземпляра, потому что это минимум, который мне требовался для этой группы. Я включил тесты производительности, чтобы попасть в новую группу, и их совокупное среднее значение CPUUtilization поднялось выше пороговых значений, которые я установил для сигналов тревоги. Я просматривал историю каждого из этих сигналов тревоги, когда состояние менялось с INSUFFICIENT_DATA, затем на OK и, наконец, на ALARM. Как и ожидалось. Затем я дождался выполнения Политики. Указанные 300 секунд до исполнения пришли и ушли. Затем я решил посмотреть, сколько времени потребуется, прежде чем политики будут выполнены. Прошло уже более полутора часов, а эти Политики еще не реализованы.
Я был разочарован и удалил ASG и все политики и предупреждения. Я решил, что, возможно, я допустил ошибку при создании политик и предупреждений. Я воссоздал их все. Та же проблема. Сигналы тревоги находятся в состоянии СИГНАЛИЗАЦИИ и никогда не выполняют Политики. Я могу без проблем выполнять политики вручную, но это неважно.
Если это имеет значение, я создал все это в Консоли AWS. В прошлом я использовал API для создания ASG и политик, и эти группы прекрасно выполняли политики.
Что-то я делаю не так? (Или, возможно, у сервисов AWS просто проблемы.)
ОБНОВИТЬ:
Попробовал сегодня снова. Решил использовать API вместо консоли, чтобы посмотреть, есть ли разница. Будильник, который я использую, обновился с OK на ALARM 20 минут назад.
CPUUtilization >= 35 for 5 minutes
Actions: In ALARM: For group TEST use policy Scale Out API (Add 1 instance)
Namespace: AWS/EC2
Metric Name: CPUUtilization
Dimensions: AutoScalingGroupName = TEST
Statistic: Average
Period: 5 minutes
2013-12-19 15:13 UTC-7 - Обновление состояния - Тревога обновлена с OK на ALARM
Текущее время: 15:43 UTC-7 (30 минут после будильника)
Действие не сработало. Есть идеи, почему?
Я задал этот вопрос на Форумы Amazon и, по-видимому, есть недавняя ошибка в создании Alarms, которая автоматически устанавливает для свойства "ActionsEnabled" значение False.
Из AWS:
We have identified an issue in the AutoScaling console regarding the binding of
AutoScaling policies to CloudWatch alarms and are working on a fix. We will post
an update to this thread once the fix is rolled out. Thanks for bringing this to
our attention.
Обходной путь на данный момент:
In the meantime, please try calling the DescribeAlarms CloudWatch API. If the
alarms associated with your policies have ActionsEnabled=false, then this could
cause your policies to not be invoked when the alarm is triggered. Please try
calling the PutMetricAlarm CloudWatch API to update ActionsEnabled=true for the
affected alarms, and that should fix the issues you are experiencing.
Я подтвердил ошибку и способ ее решения своими собственными сигналами тревоги через API.