В последнее время у меня такое странное поведение с моим EC2. Иногда (не всегда), когда моя группа автомасштабирования создает новый EC2, EC2 не может запустить свои пользовательские данные, потому что yum сломан и не может ничего получить.
Но я все еще могу подключиться к моему EC2 по SSH, запустить пользовательские данные самостоятельно, и вдруг все работает нормально. Это означает, что это вряд ли проблема прокси (я так думаю).
Это след, который у меня есть из / var / log / cloud-init-out: журналы
(Извините за ссылку, но когда я попытался скопировать в стек, все было запутано ..)
Если у вас есть идеи
Спасибо.
Журналы показывают:
Cannot find a valid baseurl for repo: amzn2-core/2/x86_64 Could not retrieve mirrorlist http://amazonlinux.eu-west-1.amazonaws.com/2/core/latest/x86_64/mirror.list error was 12: Timeout on http://amazonlinux.eu-west-1.amazonaws.com/2/core/latest/x86_64/mirror.list: (28, 'Connection timed out after 5000 milliseconds')
Так user_data
выполнение не удается, потому что yum
завершается ошибкой, поскольку истекло время ожидания соединения с репозиторием. Это проблема.
Если это происходит часто и поскольку это репозиторий, размещенный на aws, я бы исключил, что репозиторий часто будет недоступен, и начну искать проблемы в вашей среде aws.
Однако с предоставленной информацией можно только догадываться, в чем может быть проблема. Как экземпляры в ASG, выполняющие скрипты user_data, подключены к Интернету? Возможно, между ними есть NAT-шлюз или брандмауэр, вызывающий проблемы с подключением к репо.
Самый надежный и быстрый способ включить масштабирование группы с автоматическим масштабированием - это настроить AMI
и установите эти пакеты в AMI. Это делает процесс более устойчивым к сбоям сторонних служб.