У меня есть двойной сервер Opteron под управлением Linux с libvirt для размещения нескольких виртуальных машин. Виртуальные машины работают нормально, и сервер обрабатывает все нормально, но я заметил, что один процессор всегда работает около 69 ° C (дросселируется при 70 ° C), а другой - около 15 ° C.
Мне это не кажется нормальным? Разве они оба не должны быть немного ближе по температуре?
Я не знаю, как дальше дианозировать. Может, на одном из процессоров не хватает термопасты?
Изменить: материнская плата ASUS KGPE-D16 и охлаждается двойным Поклонники Noctua NH-U9DO.
Обратите внимание, что я думаю, что температура может быть ниже температуры окружающей среды, а не абсолютных значений? Когда сервер простаивает, температура процессора падает до 2C и 13C. Я использую конфигурацию lmsensors из Вот
Проблема в том, что радиатор плохо подогнан. Может быть, плохо подходит - не подходящее описание. Оказывается, нужно нанести термопасту на радиатор, а не на пластиковую крышку, которая закрывает радиатор.
После снятия пластиковой крышки процессор стал красивым и классным, спасибо всем!
По моему опыту, парные компоненты в корпусе работают при разных температурах - это нормально, потому что воздушный поток не везде одинаков. Вот график температуры жесткого диска из моего колокольчика. Диски зеркалированы, поэтому нагрузки на них практически идентичны.
Как видите, они отслеживают друг друга, но это не одно и то же; они также, в среднем, всего на 6C друг от друга. Независимо от того, сообщают ли ваши датчики об абсолютной температуре или о перегреве, разница в 55 ° C под нагрузкой кажется очень неправильной. Если вы уверены, что данные верны, то, учитывая, что разница в состоянии покоя падает до 10 ° C, что является той разницей, которую я вижу из-за воздушного потока, я подозреваю, что радиатор установлен плохо.
Это не. Если у вас нет серьезных проблем с воздушным потоком. Или один из кулеров плохой. Температура будет меняться, но не так сильно (70 против 15 градусов по Цельсию).
Учитывая, насколько низко 15 градусов, я бы предположил: (а) ваш датчик выключен (вы действительно храните сервер в этой прохладной комнате?).
Я также предполагаю, что один из процессоров просто не работает вообще по какой-либо причине.
Небольшие различия - это нормально. Могут быть несколько более крупных (на мой взгляд, поток воздуха). но здесь мы говорим о том, что один из них ХОЛОДНЫЙ.
Это может быть либо охлаждение, либо неравномерная загрузка (учитывая разницу температур, возможно, ваша ситуация неравномерная). Вы должны использовать что-то вроде prime95, чтобы равномерно загрузить все ядра и посмотреть, меняются ли темпы. Если это не так, вам необходимо сбалансировать виртуальные машины, убедиться, что ваши приложения многопоточные и заняты. Как это сделать, зависит от вашего программного обеспечения и индивидуальной рабочей нагрузки, поэтому на самом деле это выходит за рамки вопроса. Имейте в виду, что в этом нет никаких реальных преимуществ, если у вас недостаточно нагрузки для заполнения одного процессора / ядра, на самом деле ваша виртуальная машина может сознательно избегать использования второго процессора, чтобы она могла перейти в режимы энергосбережения на нескольких -cpu системы.
Если вы сузили его до охлаждения. Небольшая разница в 10 ° C может быть слишком маленькой (или слишком большой!) Термопастой. Большая разница указывает на серьезную проблему или различие между кулерами процессора. Возможно, кто-то заблокировал воздушный поток, вышел из строя радиатор и т. Д.
Я должен согласиться с дефектным темп. датчик, так как 15С это всего 59F !!! Если бы компьютер не находился в чрезвычайно холодном центре обработки данных, я мог бы предположить, что температура окружающего воздуха будет выше 59F! Вы пытаетесь назначить виртуальные машины низкотемпературному ядру и смотрите, есть ли какие-либо изменения; в противном случае я бы очень подозревал, что датчик неисправен.
Вы также можете посмотреть на вывод dmesg
(загрузочные сообщения) и посмотрите, нет ли там чего-нибудь необычного.