У моего работодателя, как я считаю, много данных. В настоящее время у нас есть около 10 ТБ данных на нашем NAS, что примерно соответствует его емкости, и у нас было бы больше данных на нем, если бы мы не перемещали данные постоянно на внешние жесткие диски и DVD для освобождения места. Поскольку нам нужно использовать все эти данные, а у нас нет возможности их хранить, наши резервные копии находятся в беспорядке.
По моим расчетам, для хранения всех имеющихся у нас данных, а также наших архивов и резервных копий нам потребуется около 200 ТБ хранилища, что также дает небольшой ожидаемый рост в следующие несколько лет.
У меня вопрос: с 200 ТБ дискового пространства, нужно ли нам настраивать SAN, или вместо этого я должен искать большой NAS, такой как устройство NetApp, или что-то совсем другое? В какой момент требования к хранилищу данных становятся достаточно высокими, чтобы оправдать усилия, связанные с настройкой и администрированием SAN?
Если вы можете себе это позволить, централизованная система хранения идеально подходит для безопасного и надежного обслуживания данных вашей компании.
Тем не менее, проверьте свои математические данные - хотя резервирование серверов и компьютеров до NAS - это нормально, это почти никогда не лучший выбор. Архивы также не оптимальны для NAS. Архивы и резервные копии лучше всего размещать на чем-нибудь другом, например, на ленточном накопителе или пуле дедуплицированных дисков. В любом случае вам понадобится что-то подобное для резервного копирования первичных данных, хранящихся на NAS.
Для 200 ТБ да, вам нужен массив. Однако вы думаете в неправильном направлении, если пытаетесь противопоставить SAN и NAS. Это разные инструменты для разных работ.
NAS доступен по сети - обычно предоставляет хранилище NFS или CIFS, иногда iSCSI. (А иногда и FCOE).
SAN обычно означает сеть оптоволоконного канала, предоставляющую хосту блочное хранилище через SCSI.
По сути, SAN - это высокоскоростная сеть с малой задержкой, предназначенная для хранения.
В любом случае массив, о котором вы говорите, по-прежнему очень похож - это набор дисков, настроенных в наборе RAID. (Какую конфигурацию вы используете, зависит от бюджета и требований к производительности).
Итак, реальный вопрос - какая производительность или одновременный доступ вам нужен? NFS и CIFS через Ethernet подходят для умеренных нагрузок на производительность (особенно в сети 10G), но всегда будет больше накладных расходов протокола, чем Fibre Channel. Однако они также неплохо подходят для совместного использования хранилища между несколькими хостами / пользователями для одновременного доступа.
У SAN больше накладных расходов - пара (как минимум) HBA на сервер и порты на коммутационной матрице. Но, как правило, быстрее.
Отдельно от этого существует разница между профилями дисков резервного копирования / архивирования и внешними хранилищами - интерфейсным хранилищам требуется хорошая пиковая производительность. Бэкап - нет.
Если у вас ограниченный бюджет, немного свободного времени и некоторые навыки компьютерных фанатов, вы также можете рассмотреть возможность использования некоторых распределенных файловых систем, таких как MooseFS или GlusterFS (дополнительные варианты здесь: http://en.wikipedia.org/wiki/Comparison_of_distributed_file_systems). Я немного поиграл с MooseFS в своей предыдущей работе, и она хорошо служила хранилищем файлов. Это будет не так быстро, как, например, Но NetApp намного дешевле. И вы не будете ограничены конкретным поставщиком оборудования, потому что вы можете подключить что угодно к DFS для расширения хранилища (серверы, настольные компьютеры, ноутбуки с любыми типами дисков). Конечно, в этом случае узким местом будет пропускная способность сети.