Назад | Перейти на главную страницу

Можно ли в некоторых ситуациях безопасно заменить «корпоративные» диски на ближние / средние?

При указании серверов, как (я предполагаю) многие инженеры, не являющиеся экспертами в области хранения данных, я обычно перестраховываюсь (и, возможно, буду рабом маркетинга), стандартизируя как минимум 10 КБ дисков SAS (и, следовательно, " Enterprise »- обновите систему с рабочим циклом 24x7 и т. д.) для« системных »данных (обычно ОС, а иногда и приложений) и зарезервируйте использование накопителей среднего и ближнего уровня 7.2k для хранения несистемных данных, где производительность не является значительной. фактор. Все это предполагает наличие 2,5-дюймовых (SFF) дисков, поскольку 3,5-дюймовые (LFF) диски действительно актуальны только для требований большой емкости с низким IOP.

В ситуациях, когда нет большого количества несистемных данных, я обычно помещаю их на тот же диск / массив, что и системные данные, то есть на сервере есть только 10 КБ дисков SAS (обычно типа «One Big RAID10» настройки в наши дни). Только если размер несистемных данных является значительным, я обычно рассматриваю возможность размещения их на отдельном массиве из 7.2k mid / nearline дисков, чтобы снизить стоимость / ГБ.

Это заставило меня задуматься: можно ли было в некоторых ситуациях заменить эти 10-килобайтные диски в массиве RAID10 на 7,2-килобайтные диски без каких-либо серьезных негативных последствий? Другими словами, иногда я превышаю технические характеристики (и довольствую поставщиков оборудования), придерживаясь минимум 10 тыс. Дисков корпоративного класса, или есть веская причина всегда придерживаться этого минимума?

Например, возьмем сервер, который действует как гипервизор с парой виртуальных машин для типичной небольшой компании (скажем, 50 пользователей). У компании есть средние шаблоны ввода-вывода без особых требований. Обычный офис с 9 до 5, пн-пт, резервное копирование выполняется пару часов в сутки. Возможно, виртуальные машины могут быть контроллером домена и сервером файлов / печати / приложений. На сервере имеется массив RAID10 с 6 дисками для хранения всех данных (системных и несистемных). На мой взгляд, не являющийся экспертом, кажется, что диски среднего и ближнего уровня могут работать нормально. На примере дисков HP:

Итак, мой вопрос: разумно ли использовать как минимум 10 КБ дисков SAS, или 7,2 КБ дисков midline / nearline на самом деле более чем достаточно во многих ситуациях? Если да, то как мне определить, где находится линия, и не стать рабом невежества, перестраховавшись?

Мой опыт в основном связан с серверами HP, поэтому вышесказанное может иметь некоторый уклон от HP, но я предполагаю, что эти принципы в значительной степени не зависят от поставщика.

Здесь есть интересное пересечение дизайна серверов, дисковых технологий и экономики:

Также см: Почему диски большого форм-фактора (LFF) все еще широко распространены?

  • Переход к плотному монтажу в стойку и серверам малого форм-фактора. Например. Вы больше не видите много предложений градирен от крупных производителей, тогда как более плотные линейки продуктов пересматриваются чаще и имеют больше вариантов / доступности.
  • Застой в разработке 3,5-дюймовых корпоративных (15 КБ) дисков - 600 ГБ 15 КБ 3,5 дюйма - это почти все, что вы можете себе представить.
  • Медленное продвижение к 2,5-дюймовым дискам (7,2 КБ) - 2 ТБ - это самый большой диск, который вы там найдете.
  • Повышенная доступность и более низкая цена на твердотельные накопители большой емкости.
  • Консолидация хранилища на общем хранилище. Односерверные рабочие нагрузки, требующие высокой емкости, иногда могут обслуживаться через SAN.
  • Развитие флеш-массивов и гибридных массивов хранения плюс приток новых систем хранения.

Вышесказанное является причиной того, почему производители обычно делают акцент на серверах 1U / 2U с 8-24 2,5-дюймовыми отсеками для дисков.

3,5-дюймовые диски предназначены для случаев использования большой емкости (2 ТБ +) с низким IOP. Они лучше всего подходят для внешних хранилищ или хранилищ SAN с какой-либо формой кэширования. На корпоративных скоростях 15 000 об / мин они доступны только до 600 ГБ.

2,5-дюймовые вращающиеся диски со скоростью вращения 10 000 об / мин предназначены для более высоких требований к IOPS и обычно доступны с емкостью до 1,8 ТБ.

Вращающиеся диски 2,5 дюйма, 7,2 тыс. Об / мин - плохой вариант, поскольку они не предлагают ни емкости, ни производительности, ни долговечности, ни ценовых преимуществ. Например, стоимость диска SAS 10k на 900 ГБ очень близка к стоимости SAS 1 ТБ 7,2 тыс. Об / мин. Учитывая небольшую цену Разница в том, что диск на 900 ГБ - лучшая покупка. В примере с 1,8 ТБ, 10 КБ SAS против 2,0 ТБ, 7,2 КБ SAS, цены тоже очень близкие. Гарантия составляет 3 года и 1 год соответственно.

Поэтому для серверов и 2,5-дюймового внутреннего хранилища используйте SSD или 10k. Если вам нужна емкость и есть отсеки для 3,5-дюймовых дисков внутри или снаружи, используйте 7,2k RPM.

Для описанных вами случаев использования серверы не конфигурируются чрезмерно. Если у них есть отсеки для 2,5-дюймовых дисков, вам действительно следует использовать 10 КБ SAS или SSD. Диски средней линии теряют производительность, емкость, имеют значительно более короткая гарантия и не сильно сэкономит на стоимости.

Есть по крайней мере несколько вещей, которые мог вызывают проблемы с НЕКОТОРЫМИ типами дисков:

  • Диски, которые не предназначены для работы с вибрационной нагрузкой шасси с большим количеством дисков (маловероятная проблема с любым диском, указанным как поддерживающий RAID / NAS)

  • Прошивка, которая не поддерживает TLER или требует трудоемкой ручной перенастройки накопителя, чтобы включить его (то же самое)

  • Диски, которые никогда не тестировались с используемым RAID-контроллером, и могут иметь нераспознанные ошибки, обнаруживаемые при такой настройке.

  • Внутренние кэши записи диска, которые ведут себя таким образом (физическая запись не в порядке или с большой задержкой), что вызывает большую путаницу в случае жесткого выключения (RAID-контроллер должен быть настроен на принудительное отключение. Возможная проблема, если микропрограммное обеспечение должно когда-либо игнорировать это. Смотрите непроверенные диски :)

  • Накопитель может время от времени выполнять внутренние процедуры обслуживания, из-за которых диск может работать медленно или реагировать с достаточной задержкой, чтобы RAID-контроллер решил, что он неисправен (связано с TLER)

  • SATA в целом, в том виде, в каком он обычно реализуется, имеет меньше защиты по сравнению с SAS от диска с полностью отключенной или зависшей электроникой все на контроллере (это не теоретический риск, некоторые комбинации производителей дисков и контроллеров любят этот режим отказа).

ОГРОМНЫЙ выпуск:

(Может быть немного не по теме, но я важно!)

Когда вы имеете дело с твердотельными накопителями (как это часто бывает, или может быть так, либо соблазн) - много SSD-накопителей имеют неприятную проблему, когда они не всегда могут восстановиться после спонтанного отключения электроэнергии!

Это крошечный проблема с HDD. Жесткие диски обычно обладают достаточной емкостью для питания своей логики и достаточным угловым моментом, чтобы нести пластины до завершения записи 512-байтового блока - в случае потери питания во время записи. Однажды в редкий пока это будет не работа, приводящая к так называемой "разорванной записи", когда отдельный блок может быть частично записан. Частичная запись (albiet редко) вызовет сбой контрольной суммы в блоке, то есть этот отдельный блок будет плохим. Обычно это может быть обнаружено как неисправность самой схемой диска и исправлено вышестоящим RAID-контроллером.

SSD - это другое животное. Обычно они реализуют то, что называется «выравниванием износа» - где они не просто записывают «блок X» в физическое место для «блока X», как это делает жесткий диск. Вместо этого они пытаются написать на разница места на флеш-носителе - и они пытаются агрегировать или объединять записи (используя небольшую буферизацию). Запись в разные места включает в себя ведение «карты» того, где что-то написано, которая также буферизуется и записывается таким образом, чтобы уменьшить уровень износа. Частично выравнивание износа может включать перемещение данных, которые уже находятся на устройстве и даже не были недавно записаны.

Эта проблема заключается в том, что когда SSD теряет питание - у него много данных в памяти (не очищено), у него есть некоторые данные, которые были записаны в разные / измененные места - и у него есть эти карты в собственной памяти, которые необходимо удалить, чтобы понять структуру всех данных на устройстве.

МНОГО SSD-накопители не имеют логики или схемы, чтобы поддерживать свои контроллеры в рабочем состоянии достаточно долго при самопроизвольном отключении питания, чтобы безопасно сбросить все эти данные во флэш-память, прежде чем они умрут. Это не только означает, что один блок, который вы написали, теперь может быть в jeprody, но и другие блоки - даже все могут возникнуть проблемы с блоками на устройстве. У многих устройств тоже есть проблемы, когда они не только теряют все данные об устройстве, но устройство сам становится кирпичным и непригодным для использования.

Это все верная теория, но (работая в индустрии хранения данных) - я / мы видели, как это происходило слишком много раз на слишком большом количестве устройств, включая некоторые из наших личных ноутбуков!

Многие поставщики обсуждали создание «твердотельных накопителей корпоративного уровня», в которые были бы специально добавлены устройства («супер-колпачки») и другие схемы, чтобы обеспечить чистую «промывку» - но очень и очень трудно найти какое-либо устройство, которое конкретно В своей таблице данных указано, что он имеет достаточную, явную, протестированную защиту от таких событий и будет защищать от таких событий.

Очевидно, что если вы покупаете «массив хранения высокого класса» у ведущего поставщика, использующего флеш-технологии, либо их диски - или их система в целом был разработан с учетом всего этого. Убедитесь, что это так!

Проблема в отношении вашего вопроса: если у вас есть RAID-массив - и некоторые из дисков являются «плохими» твердотельными накопителями без этой защиты - если вы получите «спонтанное отключение электроэнергии» - вы можете потерять ВСЕ данные о НЕСКОЛЬКО диски, делающие невозможным восстановление RAID.

«Но я использую ИБП»

Также, как правило, важно отметить, что «спонтанное отключение питания» может включать такие ситуации, как BSOD и блокировки / сбои / паники ядра, когда у вас нет выбора восстановления, чтобы отключить систему.