Назад | Перейти на главную страницу

Smartd действительно сообщает, что этот диск слишком горячий?

«Атрибут использования SMART: 194 Температура_Цельсия изменена со 146 на 150». Это на CentOS 6.6.

Что это на самом деле значит? Диск действительно горячий или это, возможно, программная ошибка? Это диск eSATA емкостью 2 ТБ, он прохладный на ощупь, а сервер, расположенный в подвале, имеет температуру 70F.

# smartctl -A /dev/sdb
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-504.16.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   134   134   054    Pre-fail  Offline      -       89
  3 Spin_Up_Time            0x0007   123   123   024    Pre-fail  Always       -       507 (Average 505)
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       89
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   135   135   020    Pre-fail  Offline      -       26
  9 Power_On_Hours          0x0012   096   096   000    Old_age   Always       -       29541
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       71
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       205
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       205
**194 Temperature_Celsius     0x0002   150   150   000    Old_age   Always       -       40 (Min/Max 20/49)**
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       9

Это просто значение атрибута SMART. Это не температура в обычных единицах измерения. (это больше похоже на число от 255 (действительно очень холодно) до 0 (действительно очень жарко), в зависимости от диска, что горячее, а что нет)

Если вы хотите увидеть температуру вашего диска, используйте smartctl -A /dev/sdx

Вы получите такую ​​таблицу:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
194 Temperature_Celsius     0x0022   107   097   000    Old_age   Always       -       45

RAW_VALUE то, что вы ищете ... (мой диск довольно теплый при 45 ° C)

VALUE это значение атрибута, и когда оно становится ниже THRESH, привод готовится к запросу на замену. (Не все атрибуты имеют порог, как и моя температура)

Что касается того, что жарко, а что нет, это действительно зависит от драйва. Есть несколько устаревший бумага от Google о частоте отказов дисков, в котором говорится, что у дисков с температурой около 40 ° C самый низкий уровень отказов (по крайней мере, для Google и в 2007 году). Я помню, как читал другую статью (сейчас не могу ее найти), в которой говорилось, что высокая температура не является проблемой для жесткого диска. Резкие и частые перепады температуры могут привести к более раннему выходу диска из строя. Итак, пока температура диска довольно стабильна (вы можете контролировать это, используя что-то вроде Мунин) все должно быть в порядке.

smartd сообщает о любых изменениях атрибутов. Это не значит, что что-то не так.