Назад | Перейти на главную страницу

Следует ли выключать гибридный сервер с графическим процессором в режиме ожидания?

Есть сервер с 2 процессорами (Intel Xeon E5-2670, Sandy Bridge) и 1 графическим процессором AMD (Tahiti XT Radeon HD 7970). Также к этому серверу подключены SSD (системные и исполняемые файлы) и HDD (тяжелые данные).

Иногда сервер работает под большой нагрузкой несколько часов. Иногда сервер простаивает несколько часов (может быть более 8 часов).

Я слышал два противоположных мнения:

  1. Я не должен выключать свой сервер, потому что сервер предназначен для работы без выключения. Тысячи серверов не выключаются и работают месяц без остановок.
  2. Сервер следует выключить, если на нем нет нагрузки. Особенно из-за GPU. Ресурсы графического процессора и кулера графического процессора ограничены, поэтому не рекомендуется постоянно включать графический процессор, даже если он не находится под большой нагрузкой.

Какое мнение правильное? Следует или не следует выключать этот сервер, чтобы значительно продлить срок его службы?

UPD 1 Интересно в первую очередь о безостановочной работе GPU.

UPD 2 О выборе GPU. Это не просто игровой графический процессор. Radeon 7970 превзошла, например, Nvidia Kepler в нескольких случаях. Видеть презентация.

UPD 3 Бытует мнение, что включение машины на базе GPU на IDLE - очень плохая стратегия. Я пытаюсь понять, правда это мнение или ложь

Плюсы отключения сервера в режиме ожидания:

  • Более низкое (нулевое) энергопотребление, что позволяет сэкономить как на электроэнергии, так и на охлаждении.
  • Меньший износ вентиляторов, который, скорее всего, выйдет из строя графического процессора (или, возможно, остальной части сервера.
  • Если в любом случае у вас есть плановое отключение каждую ночь, планирование обновлений Windows станет намного проще.

Минусы отключения сервера в режиме ожидания:

  • Двигатели (как вентиляторы, так и вращающиеся приводы) с большей вероятностью не раскрутятся, чем не продолжат вращаться.
  • Сервер недоступен, если ему нужно поработать посреди ночи
  • Нагрузка на компоненты - существует большая разница температур (особенно в помещении с кондиционером) между работающим сервером и выключенным. Цикл температуры заставляет металл каждый раз расширяться и сжиматься, что в конечном итоге приводит к износу деталей.
  • Проблемы с программным обеспечением и ОС чаще возникают во время загрузки. Возможно, последний пакет обновлений Windows что-то напутал, или ваш загрузчик поврежден и т. Д. Конечно, они все равно появятся при следующей перезагрузке, но, по крайней мере, вам не нужно беспокоиться о них каждый день, и спешите чинить их в 8:50 до того, как все придут в 9 утра.

Вентиляторы и жесткие диски - единственные части большинства систем, у которых есть двигатели. Двигатели жесткого диска хорошо защищены от окружающей среды, но вентиляторы подвергаются воздействию всей пыли, содержащейся в воздухе. Поэтому они быстро изнашиваются по сравнению с другими деталями. Вот почему на большинстве серверов они поддерживают горячую замену - вы можете заменить их, не выключая сервер. Кроме того, вентиляторов больше, чем необходимо, поэтому отказ одного вентилятора не вызывает перегрева системы.

Однако это не означает, что их отключение - это обязательно хорошо. Большинство вентиляторов, которые начинают изнашиваться, работают нормально, когда набирают скорость, но не запускаются. Таким образом, они вообще не сработают при повторном включении сервера, но, возможно, продолжали бы работать, если бы оставались включенными все время.

Мысли конкретно о видеокарте:

  • Используемая вами видеокарта предназначена для высокопроизводительных игровых систем. AMD FirePro линейка видеокарт предназначена для серверного использования.
  • Одно из больших различий, которое вы сразу заметите, заключается в том, что только у самой старшей модели есть вентилятор, остальные имеют пассивное охлаждение. Тот, у которого есть вентиляторы, на самом деле их было 3, и они больше и, вероятно, более прочные, чем вентиляторы на игровых видеокартах.
  • Серверные видеокарты также рассчитаны на круглосуточную рабочую нагрузку, поэтому в целом они имеют более прочные компоненты.

Все видеокарты замедляют работу своих вентиляторов и снижают энергопотребление в режиме ожидания. Не существует «ограниченного ресурса графического процессора», если вы имеете в виду что-то вроде «после 1 триллиона вычислений видеокарта умрет», но определенно существует ограниченное количество часов, в течение которых вентилятор проработает на нем, прежде чем выйдет из строя. Что касается настольных компьютеров, у меня было множество систем с выделенными видеокартами, которые работали почти 24x7 в течение 2-3 лет, пока не умер вентилятор видеокарты. Я полагаю, что в реальной серверной комнате, где, как мы надеемся, меньше тепла и пыли, чем в среде настольного компьютера, она могла бы работать довольно долго без обслуживания. Но на всякий случай я бы заказал пару вентиляторов на замену, чтобы один был готов, если он умрет.

Вывод

  • Держите сервер включенным, даже если он простаивает, если только он не будет простаивать много дней или недель подряд. И даже тогда я бы оставил его включенным.
  • Возьмите запасные вентиляторы для этого графического процессора. Тем более, что их будет сложно найти через год-два, когда карта будет считаться устаревшей.
  • Рассмотрите возможность замены графического процессора на эквивалент серверного уровня. Будет ли это хорошим вариантом, зависит от ваших потребностей в обработке GPU и бюджета. Вы можете решить, что дешевле иметь целую запасную карту на случай, если одна из них умрет.