Назад | Перейти на главную страницу

Какой инцидент может привести к остановке виртуальной машины в Azure?

Мы размещали веб-сайт и CMS у внешнего поставщика. Они сказали нам, что размещают все в Microsoft Azure. Вчера я увидел, что мой сайт не работает, и связался с ними. Позже в тот же день они сказали мне, что на нашем сервере произошел сбой «виртуального жесткого диска». И самые свежие данные, которые не были скопированы, теряются. Я знаю, что на этой машине работала ОС Ubuntu 14.04. Я также знаю, что каждое хранилище в Azure избыточно в 3 раза, если не больше. Помимо временного хранилища. Теперь я предполагаю, что либо они использовали временное хранилище для каких-либо действий, либо сбой не был отказом жесткого диска. Я искал в Google подобные инциденты в прошлом, но не нашел ни одного. Кроме того, все мои собственные машины Azure работают без проблем целую вечность.

Что может случиться, что сбой виртуального диска приведет к потере всех моих данных? Это не должен быть вопрос, основанный на мнении, означающем «доверяете ли вы моему поставщику». Я хотел бы знать возможные причины отказа жесткого диска в хранилище с 3-кратным резервированием. Также предполагается, что ни один администратор не получил доступ к Azure и не остановил и не отключил машину вручную.

Как вы правильно утверждаете, все дисковое хранилище Azure (за исключением временных дисков) реплицируется 3 раза на одном контроллере домена, а если вы используете георепликацию еще 3 раза на другом контроллере домена, то на самом деле сбой диска является маловероятной причиной. Есть несколько причин, которые могут объяснить это:

  • Как упоминает HopelesNoob, это может быть повреждение данных, если вы получите некоторые поврежденные данные, они будут быстро реплицированы на реплики вашего хранилища. Остается только восстановить из резервной копии.
  • Данные хранились на временном диске. Все виртуальные машины Azure получают второй временный диск, который подключен к хранилищу на локальном хосте и не является избыточным и будет удален, если машина переместится на новый хост. Его следует использовать только для временных данных.
  • Ошибка пользователя, я подозреваю, что это более вероятно, что кто-то сделал что-то или удалил то, чего не должен, и никакая репликация в этом не поможет. Опять же, резервные копии здесь ваш друг. Вы бы надеялись, что, если это так, они признают это.