У нас есть несколько роботов, установленных в разных местах и обслуживающих клиентов. Все роботы получают свои инструкции из центральной облачной базы данных с данными клиентов, и у каждого есть очередь SQS, которая доставляет команды, которые они должны выполнить, и роботы транслируют любые события, используя SNS, и некоторые лямбда-выражения запускаются этими сообщениями SNS и обрабатывают их. .
Теперь мы хотим иметь лучшую обработку и обзор ошибок, возникающих на роботах, и в целом иметь лучшую статистику.
Что нам нужно:
recovery_error
который требует ручного обслуживания)Общая статистика результатов за определенный период
Все сообщения имеют type
атрибут, который может быть status
, warning
, error
или recovery_error
и value
атрибут, который описывает тип статуса, ошибки и т. д.
Я считаю, что лямбда-выражение, подписанное на все сообщения SNS, будет загружать их в другую систему, которая затем будет собирать все это и предоставлять все необходимое для извлечения данных, упомянутых выше.
Какие продукты AWS вы бы порекомендовали для этого? Я уже немного посмотрел на CloudWatch, но не уверен, сможет ли он удовлетворить наши потребности.
Мы также рассмотрели возможность просто выгрузки всех сообщений SNS в базу данных и выполнения пользовательских запросов к таблицам. Но это звучит как решение, которое может быстро потребовать много работы с нашей стороны по мере роста наших потребностей.
Мы бы предпочли готовое решение и приспособили бы наш рабочий процесс к нему.
Заранее благодарим за любые советы.
CloudWatch предоставляет готовые метрики на основе времени, а также прием, запросы и информационную панель журналов. Также он выдает тревожные сигналы на основе показателей. Как правило, он удовлетворяет вашим требованиям по сбору показателей ваших устройств, предупреждению о возникновении каких-либо ошибок и наличию панели статистики за заданный период. Даже вы можете использовать агент / API CloudWatch для прямой отправки данных с устройств.
Кроме того, управляемый эластичный поиск с помощью Kibana также обеспечивает отличные возможности агрегирования данных и лучший пользовательский интерфейс панели инструментов.
Другой подход - использование услуг Интернета вещей, которые, вероятно, лучше соответствуют вашим требованиям.