Один из моих серверов показывает странное изменение контролируемых параметров. В минувшее воскресенье вечером одно из замеров напряжения ( in0 что я думаю Vcore) внезапно увеличился на 20% с ~ 1 В до ~ 1,20 В. Соответствующее значительное увеличение заявленных температур ядра ЦП и скорости вращения вентилятора ЦП, но очень небольшое увеличение частоты ЦП (1,20 ГГц -> 1,25 ГГц) и базовой нагрузки ЦП.
Что это могло значить? Подозреваю выход из строя БП или МБ. Есть ли другие хорошие объяснения такому поведению? На данный момент никаких изменений в серверном оборудовании, настройках BIOS или программном обеспечении не было.
Серверная МБ - Gigabyte GA-MA69VM-S2 с двухъядерным процессором AMD Athlon (tm) 4450e. ОС - Ubuntu 12.04.2 LTS с ядром 3.2.0-45-generic. Мониторинг осуществляется lm-сенсорами 1: 3.3.1-2ubuntu1. Текущий вывод команды датчиков находится под графиками.
k8temp-pci-00c3
Adapter: PCI adapter
Core0 Temp: +38.0°C
Core0 Temp: +35.0°C
Core1 Temp: +35.0°C
Core1 Temp: +37.0°C
it8716-isa-0228
Adapter: ISA adapter
in0: +1.20 V (min = +0.00 V, max = +4.08 V)
in1: +1.89 V (min = +0.00 V, max = +4.08 V)
in2: +3.36 V (min = +0.00 V, max = +4.08 V)
+5V: +2.98 V (min = +0.00 V, max = +4.08 V)
in4: +3.07 V (min = +0.00 V, max = +4.08 V)
in5: +3.23 V (min = +0.00 V, max = +4.08 V)
in6: +0.10 V (min = +0.00 V, max = +4.08 V)
5VSB: +3.02 V (min = +0.00 V, max = +4.08 V)
Vbat: +3.02 V
fan1: 1555 RPM (min = 0 RPM)
fan2: 2860 RPM (min = 0 RPM)
temp1: +29.0°C (low = +127.0°C, high = +127.0°C) sensor = thermistor
temp2: +34.0°C (low = +127.0°C, high = +127.0°C) sensor = thermistor
temp3: +31.0°C (low = +127.0°C, high = +127.0°C) sensor = thermal diode
cpu0_vid: +1.200 V
intrusion0: ALARM
Хорошие данные / исследования и т. Д., И это действительно похоже на то, что вы предлагаете, что-то увеличено vcore на .2v - не знаю почему, но все после этого следует этому шаблону - по-видимому, у вас нет запасного процессора, чтобы переключиться, чтобы увидеть если это чип или VRM правильно? это все, что я предлагаю на самом деле, разделите проблему на части и посмотрите, остается ли проблема.