У меня есть настройка сигнализации CPUUtilization для моего экземпляра ec2. Настройки будильника:
CPUUtilization >= 95% for 15 consecutive periods of 1 minute (15mins total)
Мы по-прежнему получаем электронные письма с предупреждениями, даже если экземпляр не переходит в заданное состояние тревоги.
Электронная почта, которую мы с командой получаем, объясняет:
Вы получили это электронное письмо, потому что ваш Amazon CloudWatch Alarm ... перешел в состояние ALARM, потому что «Threshold Crossed: 3 точки данных были больше или равны пороговому значению (95,0). Самые последние данные: [99.466, 98.45] ...
3 точки данных? Насколько я понимаю, моя установка 15 последовательных периодов по 1 минуте должна предупреждать, только если 15 данные были больше 95%.
Я неправильно понимаю текст электронного письма? Мои настройки будильника с чем-то конфликтуют?
Ваш экземпляр EC2 должен быть включен для мониторинга с интервалом в 1 минуту. Если у вас нет включен подробный мониторинг на вашем экземпляре EC2, то вы будете собирать данные с 5-минутными интервалами. 3 последовательных периода с 5-минутными интервалами составят 15 минут.
Я не уверен, но после просмотра некоторых из моих собственных будильников Cloudwatch и игры с новым в консоли ... похоже, что в этом случае состояние будильника срабатывает на основе минут, а не периодов - мы просто определяем минут в единицах периодов на момент создания будильника. Мне это кажется разумным - иначе ваш будильник никогда не смог бы перейти в состояние тревоги, если бы детальный (1-минутный) мониторинг был отключен.
По поводу детального мониторинга: я бы на этот случай включил, если он отключен. Если вы используете базовый (5-минутный) мониторинг, 3 точки данных не обязательно означают, что загрузка ЦП была> = 95% в течение 15 минут подряд. Это скорее означает, что загрузка ЦП была> = 95% во время выборки данных для трех последовательных выборок.
Amazon позволяет создавать будильники на 1 минуту, даже если у вас не включен подробный мониторинг, но нет данных за 4 минуты. Если вы видите консоль CloudWatch, ваш будильник должен быть в Insufficient
состояние на 4 минуты и измените на OK
каждые 5 минут. Так что все будет хорошо, если вы просто измените период на 5 минут или, возможно, включите подробный мониторинг.
Периоды CloudWatch:
Это зависит от того, какой период вы выберете, а не от его значения.
Если вы выберете минуты, то 1 последовательный период составит 1 минуту, а 10 последовательных периодов - 10 минут.
Если вы выберете часы, то 1 последовательный период равен 1 часу, а 10 последовательных периодов - 10 часам.
Если вы выбираете дни, то 1 последовательный период равен 1 дню, а 10 последовательных периодов - 10 дням.
В вашем случае вы выбрали период как 15 минут, а затем 15 последовательных периодов, но данные были доступны только каждые 5 минут, поэтому он имеет только 3 точки данных.