Назад | Перейти на главную страницу

Чем облачное хранилище (Amazon AWS, Microsoft Azure, Google Apps) отличается от традиционных сетей хранения данных центра обработки данных (SAN и NAS)?

Некоторая путаница из-за моего вопроса, чтобы упростить:

«Какие хранилища используют крупные облачные провайдеры и почему?»

Однако, насколько я понимаю, я не могу найти никаких официальных различий в сетях хранения данных между типичными центрами обработки данных и облаками, все облачные провайдеры используют DAS, отличные от типичных центров обработки данных.

Даже у DAS есть много недостатков, чем у SAN или NAS, я хочу узнать подробности, почему облака используют DAS для хранения или приложений.

Мы будем благодарны за любой ресурс или описание, чтобы прояснить ситуацию.

РЕДАКТИРОВАТЬ: Читая статью «Сетевые вызовы и результирующие подходы к построению крупномасштабного облака, Дэвид Бернштейн и Эрик Людвигсон (Cisco)» они упоминают, что:

Любопытно, что мы не видим облаков от крупных провайдеров, использующих NAS или SAN. Типичная облачная архитектура использует DAS, что не типично для хранилищ Datacenter.

Но здесь возникает конфликт: по моему мнению, а также указано далее в документе, облака должны использовать SAN или NAS, поскольку DAS не подходит, когда виртуальная машина перемещается на другой сервер, но все еще нуждается в доступе к хранилищу с исходного сервера.

По каким еще причинам облака предпочитают DAS, NAS или SAN? какое хранилище используют крупные облачные провайдеры и почему?

Этот ответ был отредактирован после уточнения вопроса.

По каким еще причинам облака эффектов предпочитают DAS

Где «DAS» означает хранилище с прямым подключением, то есть жесткие диски SATA или SAS.

Все поставщики облачных услуг используют DAS, потому что он предлагает на порядок повышение цены / производительности. Это случай масштабирование по горизонтали.

Короче говоря, жесткие диски SATA и контроллеры SATA - дешевый товар. Это товары массового потребления и по очень низким ценам. Создавая большой кластер дешевых ПК с дешевыми дисками SATA, Google, Amazon и другие компании получают огромную емкость по очень низкой цене. Затем они добавляют сверху свой собственный программный слой. Их программное обеспечение выполняет многосерверную репликацию для обеспечения производительности и надежности, мониторинга, повторной балансировки репликации после сбоя оборудования и других вещей.

Вы можете взглянуть на МогилеFS как более простой представитель программного обеспечения, которое Google, Amazon и другие используют для хранения. Это, конечно, другая реализация, но она разделяет многие из тех же целей проектирования и решений, что и крупномасштабные системы. Если хотите, вот отправная точка, чтобы узнать больше о GoogleFS.

указано далее в документе, облака должны использовать SAN или NAS, поскольку DAS не подходит, когда виртуальная машина перемещается на другой сервер.

Есть 2 причины, по которым SAN не используются.

1) Цена. SAN очень дороги в больших масштабах. Хотя они могут быть технически «лучшим» решением, они, как правило, не используются в очень крупных установках из-за стоимости.

2) Теорема CAP Теорема Эрика Брюера CAP показывает, что в очень большом масштабе невозможно поддерживать строгую согласованность при сохранении приемлемой надежности, отказоустойчивости и производительности. SAN - это попытка обеспечить единообразие аппаратного обеспечения. Это может хорошо работать для установки на 5.000 серверов, но никогда не было доказано, что это работает для более чем 250 000 серверов Google.

Результат: До сих пор поставщики облачных вычислений предпочитали переложить сложность поддержания состояния сервера на разработчика приложений. Текущие облачные предложения не обеспечивают согласованного состояния для каждой виртуальной машины. Серверы приложений (виртуальные машины) могут выйти из строя, а их локальные данные могут быть потеряны в любой момент.

У каждого поставщика есть собственная реализация постоянного хранилища, которое вы должны использовать для важных данных. Предложения Amazon - хорошие примеры; MySQL, SimpleDB, и Простая служба хранения. Эти предложения сами по себе отражают теорему CAP - экземпляр MySQL имеет сильную согласованность, но ограниченную масштабируемость. SimpleDB и S3 фантастически масштабируются, но согласовываются только в конечном итоге.

Если ты используйте DAS, тогда доступность - это ваша проблема

Если Oни используйте DAS, тогда доступность - их проблема. И если они хороши, они будут использовать несколько уровней абстракции, чтобы их проблема не стала вашей проблемой. Вместо того, чтобы зацикливаться на том, как они решают монтировать свои диски внутри своего центра обработки данных, проблема заключается в том, соответствует ли доступность, которую они гарантируют в своем соглашении об уровне обслуживания, вашим потребностям. О, и настоящий слон в комнате, что вы будете делать, если они выйдут из бизнеса (вероятно, для некоторых провайдеров это вряд ли, но вы все равно должны это учитывать) и что вы будете делать, если вы используете эти данные локально и ваше межсетевое соединение недоступен - последний вариант значительно более вероятен, чем их выбор DAS, который напрямую приведет к отключению.

(Только мнение и в значительной степени обобщающее.)

Разница заключается в уровне абстракции, на который вы смотрите (обычно).

SAN / NAS обычно предоставляют вам том, на котором вы можете установить файловую систему. Ценность этого подхода к конечной системе заключается в том, что вы передали на аутсорсинг детали физического оборудования (например, уровень RAID, физическое местоположение и т. Д.).

Напротив, облачное хранилище обычно предоставляет вам интерфейс к файловой системе. Преимущество здесь в том, что вы часто можете получить функции более высокого порядка бесплатно (например, Dropbox прозрачно автоматически контролирует версии каждого файла).

Хотя я не знаю ответа на вопрос о DAS и SAN / NAS ... При поиске решений для хранения следует учитывать множество вещей.

Количество данных? Если мы берем около Гб, хорошо, NAS с резервной копией может справиться с этой задачей. Если есть террабайты данных, цена очень быстро растет.

Я думаю, что цена - это главный фактор ... если у вас есть SAN, вам нужно:

  • Админы для настройки / управления им.
  • Серверная (электричество, пропускная способность, меры безопасности в этой комнате, ...)

И все же у вас вообще нет избыточности. Если у вас есть доступ к центру обработки данных, все может быть иначе.

Еще одна вещь, которую следует учитывать, - это доступность. Вы архивируете? Если такая доступность не проблема, пару раз в день / неделю / месяц вы архивируете в свое хранилище.

С другой стороны, если у вас есть данные, к которым требуется постоянный доступ, вы быстро обнаружите узкое место в полосе пропускания, аппаратные ограничения (например, ввод-вывод). Но с другой стороны, если у вас большой объем передаваемых данных, высока вероятность того, что решение для онлайн-хранилища будет вам дорого стоить.

ROI (возврат инвестиций) - это то, что рекламируют все поставщики онлайн-хранилищ, и они часто оказываются правы, конечно, в зависимости от использования.

Удачи.