У нас уже несколько месяцев работает сервер (CentOS) в EC2. Все шло гладко до сегодняшнего дня, когда мы получили сигнал о недоступности сервера (недоступен HTTP-сервис). Итак, я попробовал SSHing в коробке, но это тоже истекло. Я вошел в консоль EC2, и она сказала, что экземпляр запущен и в системном журнале ничего нет. Я заметил одну странную вещь: несмотря на то, что к нему подключен эластичный IP-адрес (который отображается в области управления эластичным IP-адресом), детали экземпляра не показывают, что с экземпляром связан EIP.
Я просмотрел журнал сообщений и последнее, что я увидел примерно в то время, когда мы получили уведомление, это то, что dhclient продлил аренду. Я предполагаю, что могла быть какая-то проблема с сетью.
Как я могу проверить, была ли проблема в этом или были какие-то другие проблемы, которые могли привести к тому, что наш экземпляр перестал отвечать?
Короче, нельзя. Если у вас есть золотая поддержка, вы можете открыть тикет, и иногда они дадут вам немного больше информации, но в противном случае все, что вы можете сделать, это закрыть экземпляр и запустить новый.
Время от времени мы сталкиваемся с подобными сбоями с EC2. Мы просто держим инстансы в режиме ожидания наготове, если это произойдет.
Разве вместо того, чтобы держать экземпляр в режиме ожидания, подходящая метрика автомасштабирования не приведет к тому же решению?