У меня есть микро-экземпляр на бобовом стебле амазонки.
Каждые пару дней он зависает на 100% ЦП и зависает, пока я не сбросил его вручную. У меня вопрос - почему он застревает? Он остается в этом состоянии еще долго после того, как любой пользователь попытается его использовать.
Кроме того, есть ли простой способ получать уведомления по электронной почте, когда сервер входит в режим предупреждения?
Мы не можем сказать вам, почему сервер работает на 100%. Вам нужно выяснить, какой процесс использует ЦП. Для Linux посмотрите вверху или наверху, чтобы использовать диспетчер задач Windows. Как только вы выясните, что использует процессор, вы можете просмотреть журналы и тому подобное.
Я знаю, что в AWS не существует «режима предупреждения» как такового. Экземпляры EC2 имеют жизненный цикл экземпляра, возможно, вы могли бы посмотреть на это, чтобы прояснить, что вы имеете в виду. Есть функция автоматического восстановления на EC2.
AWS CloudWatch это система, которую следует использовать для мониторинга и оповещения. Довольно просто настроить его так, чтобы он предупреждал, когда ваш процессор, пропускная способность сети, дисковое пространство или множество других вещей превышают установленные вами пороговые значения. Он может контролировать всю вашу инфраструктуру AWS.
CloudWatch может быть метриками монитора по умолчанию, видимыми для гипервизора, включая ЦП. Если вы хотите отслеживать использование ОЗУ или диска в Linux, вам необходимо использовать эти сценарии отправить метрики в CW.