Назад | Перейти на главную страницу

Надежность хранилища Amazon EC2 EBS

Мы запускаем несколько инстансов Ubuntu на Amazon EC2, и за последние два месяца мы наблюдали, как некоторые из них перестали отвечать на запросы и становились недоступными. Нет SSH, ответов ping и т. Д. В конце концов, перезагрузка этих экземпляров помогла в крайнем случае.

Все затронутые экземпляры основаны на EBS. В журналах нет указаний на причину сбоя. Мы подозревали, что, возможно, экземпляры каким-то образом могли разорвать соединение со своими томами EBS.

Мои вопросы:

  1. Возможно ли это вообще (я имею в виду: экземпляр теряет соединение со своим томом EBS)?
  2. Как мне отладить это и убедиться, что это так?
  3. Самое главное: как это предотвратить?

На данный момент EBS - самый надежный вариант на AWS. Это не только лучше, но и легко делать снимки и повторно подключаться к другому экземпляру. У нас есть очень большие экземпляры Ec2, основанные на EBS, которые используются медиа-сайтами и не имеют подобных проблем. Кроме того, Amazon гарантирует 99,95% времени безотказной работы для этой услуги и вернет деньги, если она выйдет из строя.

Чтобы ответить на ваши вопросы.

  1. Это маловероятно, если только по какой-то причине не испортилось здоровье вашего экземпляра. Но о подобных проблемах с плохим IOPS сообщалось и раньше. Видеть
  2. Проверьте "чтение-запись ввода-вывода" против "ожидающего ввода-вывода в очереди". Итак, если у вас 0 операций ввода-вывода, когда в очереди есть ожидающие операции ввода-вывода, у вас проблема. См. SLA.
  3. Проверить работоспособность инстанса + работоспособность IOP EBS. В некоторой степени для этого можно использовать cloudwatch. Проверьте эту ссылку.