Назад | Перейти на главную страницу

Что такое сеть хранения данных и какие преимущества она имеет по сравнению с другими решениями для хранения данных?

Я предлагаю сделать это канонический вопрос о сетях хранения данных корпоративного уровня.

Что такое сеть хранения данных (SAN) и как она работает?
Чем оно отличается от сетевого хранилища (NAS)?
Каковы варианты использования по сравнению с хранилищем с прямым подключением (DAS)?
Чем лучше или хуже?
Почему так дорого?
Должен ли я (или моя компания) использовать его?

Прежде всего, для (широкого) сравнения хранилищ DAS, NAS и SAN см. Вот.


Есть несколько распространенных заблуждений относительно термина "SAN", что значит "Сеть хранения данных" и как таковой, строго говоря, относится только к коммуникационной инфраструктуре, соединяющей устройства хранения (дисковые массивы, ленточные библиотеки и т. д.) и пользователей хранения (серверы). Однако в обычной практике термин «SAN» используется для обозначения двух вещей:

  1. Полная инфраструктура хранения, включая все оборудование и программное обеспечение, обеспечивающее общий доступ к центральным устройствам хранения с нескольких серверов. Это использование, хотя и не совсем правильное, является общепринятым и является тем, что большинство людей имеет в виду, говоря о «SAN». Остальная часть ответа будет сосредоточена на нем, таким образом описывая каждый компонент инфраструктуры хранения корпоративного уровня.
  2. Единый массив хранения (см. Ниже); например, «у нас есть SAN марки X с хранилищем 20 ТБ». Это использование в корне неверно, потому что оно даже не принимает во внимание настоящий означает «SAN» и просто предполагает, что это некая форма запоминающего устройства.

Сеть SAN может состоять из самого разного оборудования, но обычно может быть разбита на различные компоненты:

  • Массивы хранения: именно здесь фактически хранятся данные (и то, что довольно часто ошибочно называют «SAN»). В их состав входят:
    • Физические диски: они, конечно, архивируют данные. Используются диски корпоративного уровня, что означает, что они обычно имеют меньшую емкость диска, но гораздо более высокую производительность и надежность; также, они намного дороже чем диски потребительского класса. Диски могут использовать широкий спектр подключений и протоколов (SATA, SAS, FCи т. д.) и различных носителей информации (Твердотельные диски становятся все более распространенными), в зависимости от конкретной реализации SAN.
    • Дисковые полки: вот где размещаются диски. Они обеспечивают им электричество и передачу данных.
    • Контроллеры / процессоры хранилища: они управляют дисковым вводом-выводом, RAID и кэширование (термин «контроллер» или «процессор» варьируется в зависимости от поставщика SAN). Опять же, используются контроллеры корпоративного уровня, поэтому они имеют гораздо лучшую производительность и надежность, чем оборудование потребительского класса. Они могут и обычно конфигурируются парами для резервирования.
    • Пулы хранения: пул хранения - это набор дискового пространства, состоящий из нескольких (часто многих) дисков в конфигурации RAID. Он называется «пулом», потому что его разделы можно выделять, изменять их размер и отменять выделение по запросу, создавая LUN.
    • Номера логических устройств (LUN): а LUN - это кусок пространства, взятый из пула хранения, который затем становится доступным («представленным») одному или нескольким серверам. Серверы воспринимают это как объем хранилища и могут форматировать с помощью любой файловой системы, которую они предпочитают.
  • Ленточные библиотеки: они могут быть подключены к SAN и использовать одну и ту же коммуникационную технологию как для подключения к серверам, так и для прямого резервного копирования с хранения на ленту.
  • Сеть связи (собственно "САН"): это то, что позволяет пользователям (серверам) хранилища получать доступ к устройствам хранения (массив (массивы) хранения, ленточные библиотеки и т. д.); это, строго говоря, настоящий значение термина «Сеть хранения данных» и единственная часть инфраструктуры хранения, которая должен быть определенным как таковой. На самом деле существует множество решений для подключения серверов к общим устройствам хранения, но наиболее распространенными из них являются:
    • Fibre Channel: технология, которая использует оптоволокно для высокоскоростного подключения к общему хранилищу. Оно включает адаптеры главной шины, волоконно-оптических кабелей и коммутаторов FC, и может достигать скорости передачи от 1 Гбит до 20 Гбит. Также, многопутевый ввод / вывод может использоваться для группировки нескольких физических каналов вместе, обеспечивая более высокую пропускную способность и отказоустойчивость.
    • iSCSI: реализация SCSI протокол через IP-транспорт. Он превосходит стандарт Ethernet аппаратное обеспечение, что означает, что он может достигать скорости передачи от 100 Мбит (обычно не используется для SAN) до 100 Гбит. Также можно использовать многопутевый ввод-вывод (хотя базовый сетевой уровень привносит некоторые дополнительные сложности).
    • Fibre Channel через Ethernet (FCoE): промежуточная технология между полным FC и iSCSI, которая использует Ethernet в качестве физического уровня, но FC в качестве транспортного протокола, что позволяет избежать необходимости в промежуточном уровне IP.
    • InfiniBand: очень высокопроизводительная технология подключения, менее используемая и довольно дорогая, но с помощью которой можно впечатляющий пропускная способность.
  • Адаптеры главной шины (HBA): карты адаптеров, используемые серверами для доступа к уровню связи; они могут быть выделенными адаптерами (как в FC SAN) или стандартными картами Ethernet. Существуют также iSCSI HBA, которые имеют стандартное соединение Ethernet, но могут аппаратно обрабатывать протокол iSCSI, тем самым снимая с сервера некоторую дополнительную нагрузку.

SAN предоставляет множество дополнительных возможностей по сравнению с хранилищами с прямым подключением (или физически совместно используемыми):

  • Отказоустойчивость: Высокая доступность встроена в любую сеть хранения данных корпоративного уровня и поддерживается на всех уровнях, от источников питания в массивах хранения до соединений с серверами. Диски более надежны, RAID используется для противодействия сбоям одного (или нескольких) дисков, используются резервные контроллеры, а многопутевый ввод-вывод обеспечивает непрерывный доступ к хранилищу даже в случае сбоя соединения.
  • Большая емкость хранения: Сети SAN могут содержать множество больших запоминающих устройств, что позволяет использовать гораздо больше места для хранения, чем может обеспечить один сервер.
  • Управление динамическим хранилищем: тома хранения (LUN) можно создавать, изменять размер и уничтожать по запросу; их можно переносить с одного сервера на другой; выделение дополнительного хранилища для сервера требует только некоторых конфигураций, в отличие от покупки дисков и их установки.
  • Производительность: Правильно настроенная SAN с использованием новейших (хотя и дорогих) технологий может обеспечить действительно впечатляющую производительность и разработана с нуля для обработки тяжелой одновременной нагрузки с нескольких серверов.
  • Репликация на уровне хранилища: два (или более) массива хранения могут быть настроены для синхронной репликации, что позволяет полностью перенаправить серверный ввод-вывод от одного к другому в сценариях сбоя или аварии.
  • Моментальные снимки на уровне хранилища: большинство массивов хранения позволяют делать снимки отдельных томов и / или целых пулов хранения. При необходимости эти снимки можно будет восстановить.
  • Резервные копии на уровне хранилища: большинство сетей SAN также позволяют выполнять резервное копирование непосредственно с массивов хранения в ленточные библиотеки, подключенные к SAN, полностью минуя серверы, которые фактически используют данные; Для обеспечения целостности и согласованности данных используются различные методы.

Исходя из всего вышесказанного, преимущества использования сетей SAN очевидны; но как насчет затрат на его покупку и сложности управления им?

SAN - это оборудование корпоративного уровня (хотя для малых SAN может быть экономическое обоснование даже в малых и средних компаниях); они, конечно, легко настраиваются, поэтому могут варьироваться от «пары ТБ с 1 Гбит iSCSI и несколько высокой надежности» до «нескольких сотен ТБ с потрясающей скоростью, производительностью и надежностью и полной синхронной репликацией в центр обработки данных аварийного восстановления»; Стоимость варьируется соответственно, но обычно выше (как «общая стоимость», так и «стоимость гигабайта пространства»), чем у других решений. Стандарта ценообразования не существует, но даже в небольших сетях SAN нередки случаи, когда ценники составляют десятки тысяч (и даже сотни тысяч) долларов.

Проектирование и внедрение SAN (тем более для high-end) требует определенных навыков, и эту работу обычно выполняют узкоспециализированные люди. Повседневные операции, такие как управление LUN, значительно упрощаются, но во многих компаниях управление хранилищем в любом случае осуществляется специальным человеком или командой.

Независимо от вышеперечисленных соображений, SAN являются предпочтительным решением для хранения данных, когда требуются высокая емкость, надежность и производительность.

Он тебе нужен? Смотря как. £ или $ за ТБ значительно выше, чем DAS. Кроме того, я боюсь, что производительность DAS превосходит FC / AL и iSCSI SAN (ну, по крайней мере, в моем тестировании с базами данных Oracle и SQL Server). Но с DAS вы не получаете преимуществ возможности совместного использования хранилища (хорошо для кластеризации и VMWare).

Ряд поставщиков хранилищ переходят с оптоволоконного канала для соединений между хостом и контроллером хранилища в пользу iSCSI, который работает поверх Ethernet. Это снова старая сага Token-Ring против Ethernet; При таком объеме отраслевых исследований и инвестициях в Ethernet FC просто не успевает. Коммутатор Ethernet 10 Гбит / с намного дешевле, чем коммутатор FC 8 Гбит / с, к тому же он может быть vLANd или иным образом сегментирован для обеспечения хранения и хранения данных.

Однако у SAN есть несколько больших преимуществ:

  • Моментальные снимки SAN (точка восстановления на определенный момент времени для сервера или набора серверов)
  • Репликация на уровне блоков на месте и за его пределами (без участия хост-сервера, поэтому нет необходимости в программной репликации)
  • Прямое резервное копирование SAN - если ваша система резервного копирования может подключаться и работать с вашей SAN

Если вы подумываете о том, чтобы окунуться в воду с общим хранилищем, обратите внимание на такие продукты, как комплект HP P4000.