Я буду настраивать сервер на работе, и мне нужен совет по некоторым деталям. Установка будет представлять собой один блейд-сервер (8-ядерный, 16 ГБ ОЗУ) с двумя подсистемами - одна для основного хранилища, а другая для его резервного копирования. Снимаю для массива на 20 ТБ (знаю, после форматирования и четности дисков будет меньше).
Есть ли какое-то преимущество в том или ином случае с 20 дисками по 1 ТБ или с 10 дисками по 2 ТБ?
Я не уверен прямо сейчас, сколько контроллеров у меня должно быть (в цитате у меня двухпортовый контроллер). Я бы подумал, что два контроллера для сервера такого размера будут лучшим выбором, чем двухпортовый контроллер (но я действительно не знаю).
Будет ли массив такого размера иметь проблемы с производительностью в RAID 5 или 6 (я знаю, что RAID 5 или 6 «медленнее» из-за всех вычислений четности).
Кроме того, это будет WD RE3 (1 ТБ) или RE4 (2 ТБ).
Да, также, для массива резервных копий можно ли использовать зеленые диски WD 2 ТБ (также в RAID5 или 6)?
20 дисков 1 ТБ - больше производительности ввода-вывода хотя бы при чтении (зависит от того, как вы их настроите).
10 дисков 2 ТБ: меньше перфорации ввода-вывода, проблемы с качеством RAID 5 - переходите на RAID 6, чтобы избежать проблем в случае выхода диска из строя. Диски емкостью 2 ТБ - это предел, который необходимо надежно восстановить.
Я не уверен прямо сейчас, сколько контроллеров у меня должно быть (в цитате у меня двухпортовый контроллер).
Вы должны пойти на настройку SAS. Было бы нормально использовать 1 порт SAS, хотя я бы выбрал двухпортовую корзину и двухпортовый контроллер. У меня есть аналогичная установка (ну, меньше, быстрее) с использованием велоцирапторов WD 300 ГБ, и я использую Adaptec 5805 и корзину Supermicro с 24 слотами в 1 стойке (всего 2,5 дюйма) и объединительную плату SAS для них.
Обратите внимание, что SAS может работать с дисками SATA - они логически и физически совместимы, просто подключите их.
Adaptec обрабатывает до 190 дисков;) И имеет множество перфораторов ЦП для этого маленького ввода-вывода.
Да, также, для массива резервных копий можно ли использовать зеленые диски WD 2 ТБ (также в RAID5 или 6)?
Бэкап - в целом медленнее - нормально. Так да.
Если вы используете контроллер для создания RAID, то наличие двух контроллеров, очевидно, будет означать, что у вас будет два отдельных массива (например, 2 x 10 дисков или 2 x 5 дисков), если вы используете программный RAID, то это не это проблема.
Также кое-что нужно знать; 20 дисков в конфигурации R6 = 18 * (1000 * .95) = 17,1 ТБ, Windows (вы не указываете, какую ОС вы используете) будет поддерживать тома 16 ТБ с наибольшим размером кластера, но большее количество «не поддерживается» 'в лучшем случае, если это Linux, тогда все будет по-другому.
Теперь к вопросу, и мой ответ сводится к тому, насколько важны данные, которые вы храните. Я считаю, что моей основной задачей является поддержание существующих данных, все остальное является второстепенным - помня об этом, я бы хотел выбрать конфигурацию RAID 10 20 x 2 ТБ, если у вас есть бюджет, если нет, то 10 x 2 ТБ Конфигурация RAID 6 и, наконец, RAID 5. 20 x 1 ТБ. Я бы также удостоверился, что у меня есть несколько запасных дисков, лежащих поблизости, и удостоверился, что мои предупреждения о сбое диска работают нормально.
Что касается резервного копирования, то для периодического (т.е. не круглосуточного) использования эти зеленые диски в порядке.
Старайтесь держаться подальше от RAID-5 и больших (1TB +) дисков. Я попал в эту ловушку, и я не собираюсь ждать отказа диска, прежде чем перепроектировать свой рейд.
Как сказал Чоппер, если у вас есть бюджет: используйте RAID10 размером 20x1 ТБ или с двумя контроллерами; 2x10x1 ТБ. Это даст вам много лучшая скорость записи, несмотря на то, что хранилище RAW всего 10 ТБ.
Если вам действительно нужно 20 ТБ хранилища RAW, я бы запустил 2x10x2 ТБ в RAID10.
Двадцать дисков в одном рейде 5 или 6 просто напрашиваются. Вероятность отказа при восстановлении слишком высока. Я бы не стал выходить за рамки восьми дисков в Raid 6. Возьмите размер рейда, разделите его на частоту сбоев дисков и произведите вычисления.
Чтобы узнать больше о Raid 5/6, смотрите http://download.intel.com/design/storage/papers/30812202.pdf (стр. 8) или аналогичные документы.
Способом выйти за пределы 10 ТБ или около того является Raid 10. Да, он намного менее эффективен в пространственном отношении, но он превосходит по производительности и надежности при восстановлении, потому что нужно восстанавливать только зеркальное отображение.
Если посмотреть на это с инженерной точки зрения, то при условии, что они сконструированы одинаково, существует более высокая вероятность того, что диски большей емкости дадут проблемы просто потому, что все намного важнее. Все, что движется, должно приводить к износу. Чем критичнее все, тем больший эффект будет иметь износ. Кроме того, дорожки становятся настолько узкими на дисках большой емкости, что неисправность или дефект всего нескольких молекул на магнитном покрытии может привести к повреждению блоков.
Когда есть выбор и при прочих равных, я всегда буду выбирать диски меньшей емкости. Я все еще использую диски более чем десятилетней давности, но я вполне уверен, что ни один из сегодняшних дисков большей емкости не будет работать в 10 лет.
хорошо спасибо за ответы. Думаю, мне стоит рассказать немного подробнее. Я работаю в исследовательской лаборатории. У меня есть бюджет около 13 тысяч долларов, который я могу потратить на этот сервер. Мы проводим эксперименты по секвенированию, которые будут генерировать ~ 50 ГБ данных за цикл, а некоторые эксперименты по микроскопии генерируют от 25 до 50 ГБ данных за цикл. Я не совсем уверен, сколько из этих экспериментов будет проведено и как долго. Сначала я получил предложение о массиве 16 ТБ. В нем было 16 дисков SAS емкостью 1 ТБ (Seagate ES.2 SAS, 7200 об / мин). Я ничего не читал, чтобы предположить, что диски SAS 7200 об / мин лучше, чем диски RE3, поэтому, поскольку они стоят примерно на 60 долларов за диск дешевле, это дает мне гораздо больше денег для обновления характеристик ЦП и ОЗУ. Но если я вернусь к решению на 16 ТБ (которого, вероятно, более чем достаточно на какое-то время), выберу массив 16 ТБ с дисками RE3 в RAID10 (32 диска) и буду использовать диски 2 ТБ в RAID6 для резервного копирования, что все равно почти на 1 тыс. Долларов дешевле, чем 2 подсистемы SAS по 16 ТБ (7200 об / мин) - деньги, которые я могу использовать для получения более быстрых процессоров. Я также должен отметить, что в соседней лаборатории есть массивы 12 ТБ и 32 ТБ, полностью сделанные из дисков Hitachi 7K1000 (1 ТБ), и у них не было никаких проблем с этой конфигурацией. Поскольку мы не организации корпоративного класса, я не уверен, почему SAS может быть лучше.
Чтобы ответить на первый вопрос Чоппера: цитата, на которую я смотрю, гласит: «Двухпортовый контроллер LSI 8880M2 с установленным BBU». Это будет управлять двумя идентичными подсистемами (согласно цитате). Хотя то, что я описываю, представляет собой два отдельных, но почти идентичных массива (не будет ли это проблемой?) Другой вариант - это главный узел с подсистемой (без ЦП) для резервного копирования. У него есть контроллер 3Ware 96904i4e с установленным BBU.
Что касается второго вопроса Чоппера, я еще не знаю, какую ОС мы будем использовать. Вы говорите, что Windows Server 2008 не может обрабатывать массивы размером более 16 ТБ? Или просто "неподдерживаемый", так как в MS нет официальной поддержки? Я думаю, что поставщик использует CentOS для Linux, чего я терпеть не могу. У нас есть CentOS на нашем компьютере с микроскопом, и это было проблемой. Мне нужно сначала убедиться, на какой платформе работают все наши приложения, пока что Matlab, R и выравниватели, которые я использую, работают в Linux, так что никаких проблем. Я всегда мог установить Ubuntu (или Mint, мой любимый, вместо этого).
Вариантов конфигурации столько, что голова закружится! Спасибо за вашу помощь. Я надеюсь, что смогу внести свой вклад. Это полезный веб-сайт.
согласен с посипиетом. слишком много дисков значительно увеличит вероятность отказа. таким образом победите преимущества рейда.
также рассмотрите raidz2