Наша компания управляет сайтами электронной коммерции (тысячи) на двух кластерах в двух отдельных центрах обработки данных.
По сути, все, что нам нужно для работы, - это серверные узлы, монтируемые в стойку. Каждому узлу необходимо:
1.) 4 или 8 ядер 2.) 32 ГБ оперативной памяти 3.) 1 диск sata 250 ГБ 4.) 2 порта, гигабитные адаптеры Ethernet 5.) Возможность загрузки Windows XP Pro
Это. Мы запускаем около 40 таких узлов в полностью избыточном, всегда работающем (надеюсь!) Кластере (часть кластеризации мы написали сами)
Раньше мы покупали наши системы в белом ящике (в основном у нас был небольшой магазин, который настраивал наши серверы (супермикро) в соответствии с нашими спецификациями).
Эта схема хорошо работала до нашего последнего раунда покупки узлов. Из последнего раунда закупок узлов наблюдался супер-сверхвысокий уровень отказов (30% отказов за 6 мес.) Ни одной причины, плохой блок питания, плохая память, жареный мобо и т. Д.
Вот мои вопросы:
Будет ли у нас более стабильная надежность, если мы будем покупать у известного поставщика (IBM / DELL / HP), или мы в основном находимся в той же дерьмовой стрельбе надежности, в которой были раньше? Помните, что это серверы низкого уровня. Мы не собираемся переходить на мэйнфреймы или что-то экзотическое.
Будет ли наша надежность зависеть от форм-фактора серверов? Другими словами, будут ли серверы 2u более надежными, чем серверы высокой плотности, 2 узла в сервере 1U?
Кто-нибудь перешел с серверов white box на серверы именных брендов (или изменил форм-факторы) и есть что рассказать?
Торговые марки, в общем, склоняться чтобы быть более надежным, чем белые ящики (хотя supermicro не считается «белым ящиком» в моем мире), однако вы все равно будете время от времени испытывать неудачи с оборудованием известных брендов. Однако то, что вы действительно получаете, если у вас большой объем покупок и история общения с одним из старших детей, - это быстрый способ решения подобных проблем. Если вы получите бесполезную партию материнских плат от поставщика whitebox, есть ограниченный шанс, что у них будет куча запчастей, чтобы заменить их, в то время как громкое имя будет иметь запасные части для своих ушей - и долгосрочные, лояльные покупатели (т. е. «дойные коровы») получат эти запасы первыми.
В конечном счете, это компьютерное оборудование, и именно поэтому мы проводим обширные тесты на выгорание на всем полученном оборудовании. Это происходит с тревожной регулярностью, как только вы попадаете в крупномасштабное управление, и отказ от него на испытательной стойке - гораздо лучший вариант, чем отказ в производственной среде (даже если вы делать имеют системы с массовым резервированием).
Также «работает XP Pro» - вы серьезно?
поменяйте строителя, но оставьте марку.
На самом деле, оборудование Supermicro действительно хорошо. если у вас такой высокий процент отказов, я сначала подозреваю, что ребята, занимающиеся сборкой, все испортили.
Supermicro - очень надежный бренд, начиная от материнских плат и заканчивая их полноценными решениями.
Хороший строитель должен поддерживать свою работу и помогать вам, насколько это возможно. Выбор таких крупных брендов, как Dell и HP, даст вам то же самое.
Что касается типа конфигурации. Чем больше тепла будет в одном месте, тем выше вероятность отказа. Таким образом, 2 узла в 1U будут отдавать больше тепла, чем 1 в 2U. Если в стойке достаточно охлаждения, это вообще не должно иметь значения.
В Dell приятно то, что они создают ваши серверы в соответствии со спецификациями и делают это в очень чистой и приятной среде - это увеличивает срок службы их серверов. По моему опыту, никогда не открывать сервер, чтобы продлить жизнь. Я бы сказал, что если сервер работает после первого года, вероятно, он будет работать еще долгое время. Кроме того, вы хотите, чтобы ваши серверы находились в хорошем центре обработки данных, который обеспечивает хорошую среду как в электрическом, так и в физическом отношении. Стабильная температура имеет значение - изменение температуры убивает оборудование намного быстрее.
Что касается формфактора, то любой достойный поставщик, например известные бренды, строит свои системы таким образом, чтобы свести на нет большинство эффектов, связанных с формфактором. Лично я бы сказал, что это не имеет значения, хотя это не совсем так. Dell, HP и IBM хорошо известны своими идеальными моделями blade-центров. :-) Но я осмелюсь сказать, что все они в любом случае чертовски хороши, так что, в конце концов, важны их планы по замене оборудования и совокупная стоимость владения, а также серьезная корпорация.
Мы придерживаемся Dell, потому что они дешевле, чем IBM и HP, и, по моему опыту, имеют очень низкий процент отказов из-за того, как они распределяют свои материалы (сборка по спецификации и доставка). Это также экономит мне кучу времени. В прошлый раз, когда я делал покупки в HP, я купил около 30 блейд-серверов с разными дисками, хранилищем и т. Д. Он был доставлен в виде около 316 коробок. Dell отправит его как больше 10 :-) Я не люблю тратить три часа на распаковку оборудования, а затем есть перетащить его в центр обработки данных и положить в стойки (потому что это единственное безопасное место, где можно оставить оборудование).
В связи с повышением температуры я бы посмотрел на процессоры xeon серии 55xx, особенно на варианты L. Они очень энергоэффективны, обычно работают на 60 Вт или около того.
И, хе-хе, да, что там с XP? Вы используете свои веб-серверы на XP pro? :-)
При покупке оборудования у крупных OEM-производителей аргументом в пользу продажи для меня является тот факт, что, в отличие от более мелких поставщиков, крупные OEM-производители каждый день производят тысячи машин, а их процесс производства / сборки доводят до науки. У них есть производители запчастей и инженеры, которые всегда готовы помочь, а также склады запчастей и сервисные специалисты во всех крупных городских районах. Оборудование не только проходит «дорожные испытания» перед тем, как доставить его вам, оно включает в себя тысячи человеко-часов опыта и инженерных разработок. ИМХО это означает надежность, стабильность и последовательность.
Что мне не нравится в оборудовании нижнего уровня, так это вентиляция. Для серверов высокой плотности 1 или 2U критически важны вентиляторы и многие из них, а также тепловые зоны. В серверах IBM / HP / Dell это доказано наукой, они также оснащены многочисленными датчиками температуры / скорости вращения вентилятора и программным обеспечением для управления, которое предупредит вас, если что-то вышло из строя.
Если у вас уже есть все это, я бы не стал сосредотачиваться на смене бренда оборудования.
Большинство хороших серверов рассчитаны на температуру на входе около 95 градусов по Фаренгейту, но они могут быстро стать намного горячее, чем в стойке или корпусе с плохой вентиляцией.