Я знаю, что это не совсем сравнение яблок с яблоками, я пытаюсь оценить, какое из них безопаснее - с меньшей вероятностью потеря данных.
SmartOS от Joyent использует ZFS для хранения данных, тогда как машина EC2 может использовать Amazon Elastic Block Store (EBS), который хранит свои данные на S3.
Мне интересно, какие архитектурные детали делают эти две системы надежными? Я не слишком уверен в дизайне S3 относительно того, есть ли у них более одного места, в котором они хранят свои данные.
Как вы сказали, это не совсем сравнение яблок с яблоками (кроме того, уже есть согласие, что для обоих должны быть предусмотрены подходящие процедуры резервного копирования данных, поэтому я не собираюсь касаться этого). Следовательно, на этот вопрос нельзя ответить как таковой, скорее нужно знать архитектурные детали каждого предложения и применять их в отношении конкретного случая использования.
В частности, ZFS система хранения от Joyent - это локальное хранилище система, предназначенная для доставки хранилище операторского класса и надежность данных, видеть Отказоустойчивость и надежность данных:
Мы ставим ZFS на вершину высокой производительности подсистема локального хранилища чтобы ваши данные были безопасными, непротиворечивыми, всегда доступными и восстанавливаемыми. ZFS - это комбинированная файловая система и диспетчер логических томов, предназначенная для объединенное локальное хранилище. В отличие от других файловых систем, развернутых для облачного хранилища, возможность копирования при записи ZFS гарантирует, что ваш образ не будет потерян. [курсив мой]
Напротив, EBS это сетевое блочное хранилище система, предназначенная для обеспечения высокодоступные и высоконадежные тома хранения, которые можно подключить к работающему инстансу Amazon EC2 и предоставить в качестве устройства внутри инстанса, см. раздел Особенности томов Amazon EBS в пределах Amazon Elastic Block Store (EBS) для получения подробной информации, например:
- Тома Amazon EBS размещаются в конкретная зона доступности, а затем может быть присоединен к экземплярам также в той же зоне доступности.
- Каждый объем хранилища автоматически реплицируется в той же зоне доступности. Это предотвращает потерю данных из-за отказа любого отдельного компонента оборудования.
- Amazon EBS также предоставляет возможность создавать моментальные снимки томов, которые сохраняются в Amazon S3. Эти снимки состояния можно использовать в качестве отправной точки для новых томов Amazon EBS, а также защищать данные для долговременного хранения. [...]
[курсив мой]
Последний пункт подчеркивает, что EBS не хранит свои данные на S3 сам по себе, скорее, предоставляет простой в использовании механизм резервного копирования для долгосрочной надежности через S3, что подразумевает, что вам нужно будет оценить оба сценария отдельно с точки зрения надежности и доступности.
Раздел Долговечность тома Amazon EBS более подробно эта архитектура:
[...] Объем данных Amazon EBS реплицируется на несколько серверов в зоне доступности для предотвращения потери данных из-за отказа любого отдельного компонента. Долговечность вашего тома зависит как от размера вашего тома, так и от процента данных, которые изменились с момента создания вашего последнего моментального снимка. [...]
Поскольку серверы Amazon EBS реплицируется в одной зоне доступностизеркалирование данных на нескольких томах Amazon EBS в одной зоне доступности не приведет к значительному повышению надежности тома. Однако для тех, кто заинтересован в еще большей надежности, Amazon EBS предоставляет возможность создавать согласованные моментальные снимки ваших томов на определенный момент времени, которые затем хранятся в Amazon S3 и автоматически реплицируются в нескольких зонах доступности. [...]
[курсив мой]
Таким образом, в то время как EBS хранит данные на нескольких серверах только в одной зоне доступности, S3 обеспечивает дополнительное разделение физической инфраструктуры, см. Насколько изолированы зоны доступности друг от друга?:
Каждая зона доступности работает в своей собственной физически обособленной, независимой инфраструктуре. [...]. Общие точки отказа, такие как генераторы и охлаждающее оборудование, не используются в разных зонах доступности. Кроме того, они физически отдельный, так что даже крайне необычные бедствия, такие как пожары, торнадо или наводнения, затронут только одну зону доступности. [курсив мой]
Это дает заявленную долговечность 99,999999999%, как указано в Насколько надежен Amazon S3? и более подробно в Как Amazon S3 обеспечивает надежность на уровне 99,999999999%?:
Amazon S3 избыточно хранит ваши объекты на несколько устройств на нескольких объектах в регионе Amazon S3. [...] При обработке запроса на сохранение данных служба будет избыточно хранить ваш объект на нескольких объектах, прежде чем вернуть УСПЕХ. [...] [курсив мой]
Обратите внимание, что зона доступности по-прежнему ограничена одним регионом (видеть Использование регионов и зон доступности для получения подробной информации об этой архитектуре), и это уже были соответствующие инциденты, вызывающие дискуссии о том, является ли резервирование региона и / или поставщика способом достижения максимальной надежности (см. Отключения ниже).
Наконец, раздел Модель согласованности данных Amazon S3 в Концепции Amazon S3 предоставляет более подробную информацию о том, как Amazon S3 обеспечивает высокую доступность за счет репликации данных на нескольких серверах в центрах обработки данных Amazon..
Обе службы имели как минимум один серьезный сбой в прошлом - соответствующий анализ вскрытия дает дополнительное представление о конструкции каждой системы и позволяет вам учитывать это в стратегиях резервного копирования и доступности соответственно:
Последний сбой вызвал довольно много дискуссий относительно надежности облачных вычислений в целом, что интересно послужило толчком для статьи. Магазин магических блоков: когда абстракции не справляются в блоге Джойента, исследуя различия между обоими подходами и объясняя соответствующие архитектурные решения Джойента (включая самокритику прошлых неудачных попыток); хотя эту статью, очевидно, можно считать необъективной, она все же позволит вам сделать свои собственные выводы.
У вас нет данных, если они не в трех экземплярах в двух географически разных местах.
В зависимости от одного экземпляра RAID, виртуального блочного устройства, одного поставщика и т. Д. Надежное хранение ваших данных в лучшем случае небрежно.
При этом, если за последние 2-3 года с момента последней проверки ничего не изменилось, Amazon не дает никаких гарантий, что данные S3 будут там в следующий раз, когда вы посмотрите. Последние несколько лет они были надежными в том, что касается хранилища, так что не похоже, что данные регулярно исчезают.