Назад | Перейти на главную страницу

CloudWatch не соблюдает настройки будильника

У меня есть настройка сигнализации CPUUtilization для моего экземпляра ec2. Настройки будильника:

CPUUtilization >= 95% for 15 consecutive periods of 1 minute (15mins total)

Мы по-прежнему получаем электронные письма с предупреждениями, даже если экземпляр не переходит в заданное состояние тревоги.

Электронная почта, которую мы с командой получаем, объясняет:

Вы получили это электронное письмо, потому что ваш Amazon CloudWatch Alarm ... перешел в состояние ALARM, потому что «Threshold Crossed: 3 точки данных были больше или равны пороговому значению (95,0). Самые последние данные: [99.466, 98.45] ...

3 точки данных? Насколько я понимаю, моя установка 15 последовательных периодов по 1 минуте должна предупреждать, только если 15 данные были больше 95%.

Я неправильно понимаю текст электронного письма? Мои настройки будильника с чем-то конфликтуют?

Ваш экземпляр EC2 должен быть включен для мониторинга с интервалом в 1 минуту. Если у вас нет включен подробный мониторинг на вашем экземпляре EC2, то вы будете собирать данные с 5-минутными интервалами. 3 последовательных периода с 5-минутными интервалами составят 15 минут.

Я не уверен, но после просмотра некоторых из моих собственных будильников Cloudwatch и игры с новым в консоли ... похоже, что в этом случае состояние будильника срабатывает на основе минут, а не периодов - мы просто определяем минут в единицах периодов на момент создания будильника. Мне это кажется разумным - иначе ваш будильник никогда не смог бы перейти в состояние тревоги, если бы детальный (1-минутный) мониторинг был отключен.

По поводу детального мониторинга: я бы на этот случай включил, если он отключен. Если вы используете базовый (5-минутный) мониторинг, 3 точки данных не обязательно означают, что загрузка ЦП была> = 95% в течение 15 минут подряд. Это скорее означает, что загрузка ЦП была> = 95% во время выборки данных для трех последовательных выборок.

Amazon позволяет создавать будильники на 1 минуту, даже если у вас не включен подробный мониторинг, но нет данных за 4 минуты. Если вы видите консоль CloudWatch, ваш будильник должен быть в Insufficient состояние на 4 минуты и измените на OK каждые 5 минут. Так что все будет хорошо, если вы просто измените период на 5 минут или, возможно, включите подробный мониторинг.

Периоды CloudWatch:

Это зависит от того, какой период вы выберете, а не от его значения.

Если вы выберете минуты, то 1 последовательный период составит 1 минуту, а 10 последовательных периодов - 10 минут.

Если вы выберете часы, то 1 последовательный период равен 1 часу, а 10 последовательных периодов - 10 часам.

Если вы выбираете дни, то 1 последовательный период равен 1 дню, а 10 последовательных периодов - 10 дням.

В вашем случае вы выбрали период как 15 минут, а затем 15 последовательных периодов, но данные были доступны только каждые 5 минут, поэтому он имеет только 3 точки данных.