Назад | Перейти на главную страницу

Вероятность отказа корпуса блейд-модуля

В моей организации мы думаем о покупке блейд-серверов вместо стоечных. Конечно, поставщики технологий также делают их очень красивыми. Проблема, которую я очень часто читаю на различных форумах, заключается в том, что существует теоретическая возможность выхода из строя серверного шасси, что, как следствие, приведет к отключению всех блейд-серверов. Это связано с общей инфраструктурой.

Моя реакция на эту вероятность была бы иметь избыточность и два шасси вместо одного (очень дорого, конечно).

Некоторые люди (в том числе, например, продавцы HP) пытаются убедить нас в том, что отказ шасси очень маловероятен из-за множества избыточностей (резервный источник питания и т. Д.).

Еще меня беспокоит то, что если что-то выйдет из строя, могут потребоваться запасные части, что затруднительно в нашем регионе (Эфиопия).

Поэтому я хотел бы спросить опытных администраторов, которые управляли блейд-сервером: каков ваш опыт? Выходят ли они из строя в целом - и какова разумная общая инфраструктура, которая может дать сбой?

Этот вопрос можно распространить на общее хранилище. Опять же, я бы сказал, что нам нужны две единицы хранения вместо одной - и снова производители говорят, что это настолько надежно, что сбоев не ожидается.

Что ж - я с трудом могу поверить, что такая критически важная инфраструктура может быть очень надежной без избыточности - но, может быть, вы мне скажете, есть ли у вас успешные проекты на основе blade-серверов, которые работают без избыточности в своих основных частях (шасси, хранилище ... )

Сейчас мы смотрим на HP - IBM выглядит слишком дорого.

Низкая вероятность полного отказа шасси ...

Вы, вероятно, столкнетесь с проблемами на своем объекте, прежде чем поддерживать полный выход из строя корпуса блейд-сервера.

Мой опыт в основном связан с HP C7000 и HP C3000 корпуса для лезвий. Я также управлял блейд-решениями Dell и Supermicro. Продавец имеет значение. Но в целом оборудование HP было звездным, Dell - в порядке, а Supermicro не хватало качества, отказоустойчивости и просто плохо спроектировано. У меня никогда не было сбоев со стороны HP и Dell. У Supermicro действительно были серьезные сбои, вынудившие нас отказаться от платформы. На HP и Dell я никогда не сталкивался с полным отказом корпуса.

  • У меня были тепловые явления. Кондиционер не работал в объекте совместного размещения, из-за которого температура достигла 115 ° F / 46 ° C в течение 10 часов.
  • Скачки напряжения и сбои на линии: потеря одной стороны подачи A / B. Индивидуальные сбои в электроснабжении. В моих конфигурациях лезвий обычно шесть блоков питания, так что есть много предупреждений и резервов.
  • Сбои отдельных блейд-серверов. Проблемы одного сервера не влияют на остальные в корпусе.
  • В шасси Пожар...

Я видел множество сред и имел преимущество установки в идеальных условиях центра обработки данных, а также в некоторых более суровых местах. Что касается HP C7000 и C3000, главное, что нужно учитывать, это то, что шасси полностью модульный. Компоненты спроектированы таким образом, чтобы минимизировать влияние отказа компонента, влияющего на работу всего устройства.

Подумайте об этом так ... Основное шасси C7000 состоит из передней, (пассивной) промежуточной и объединительной плат. Структурный корпус просто скрепляет вместе передние и задние компоненты и поддерживает вес системы. Практически все детали можно заменить ... поверьте, я много разбирал. Основные резервы связаны с вентилятором / охлаждением, питанием и сетевым управлением. Процессоры управления (Встроенный администратор HP) могут быть спарены для резервирования, однако серверы могут работать и без них.

Полностью заполненный корпус - вид спереди. Шесть блоков питания внизу работают на всю глубину корпуса и подключаются к модульной объединительной плате питания в задней части корпуса. Возможна настройка режимов питания: например, 3 + 3 или n + 1. Таким образом, в корпусе определенно есть резервирование питания.