В Nagios есть приятная функция, называемая пассивными проверками. Вы можете определить пассивную службу и настроить «freshness_threshold». Это отлично подходит для обычных заданий (например, заданий резервного копирования или аналогичных), где администратора нужно только предупреждать, если задание выполнено. не запустить.
Так что это эффективно работает как «выключатель мертвеца». Пока все в порядке, администратор не получает никаких предупреждений. Только если задание не выполнялось определенное время, срабатывает предупреждение.
Я безуспешно пытался найти аналогичный функционал в AWS CloudWatch. Можно ли настроить оповещения CloudWatch для подобной работы?
Это возможно с помощью комбинации периода проверки, периода оценки и опции «обрабатывать недостающие данные». Проверять, выписываться https://ruempler.eu/2017/06/26/dead-mans-switch-backup-alerting-aws-cloudwatch/ для примера и фрагмент CloudFormation.
Вы должны иметь возможность сделать это, выбрав символ «меньше чем» при определении порога срабатывания сигнализации, а затем записывая вызов при каждом запуске вашей задачи.
Другими словами, если ваша метрика упадет до 0 выполнений за типичный цикл выполнения, то вызовет сигнал тревоги.