Назад | Перейти на главную страницу

Подавить сообщения журнала о незначительных изменениях температуры диска 3ware на CentOS?

У меня есть несколько серверов CentOS 5, на которых используются RAID-контроллеры 3ware.

Эти серверы забивают мою команду сообщениями о незначительных изменениях температуры, например:

Jun  8 12:32:39 HOST smartd[1231]: Device: /dev/twa0 [3ware_disk_01], SMART Usage Attribute: 194 Temperature_Celsius changed from 119 to 118 
Jun  8 12:32:39 HOST smartd[1231]: Device: /dev/twa0 [3ware_disk_03], SMART Usage Attribute: 194 Temperature_Celsius changed from 122 to 121 

Как я могу подавить эти сообщения?

По словам человека smartd.conf :

Чтобы отключить любой из 3 отчетов, установите соответствующий предел на 0. Аргументы с завершающим нулем можно не указывать. По умолчанию все отчеты о температуре отключены (´-W 0´).

В моих системах smartd по умолчанию сообщает об изменениях температуры.

Я пробовал ручной подход. В /etc/smartd.conf, У меня есть следующее:

/dev/twa0 -d 3ware,1 -a -W 0
/dev/twa0 -d 3ware,3 -a -W 0

Но это по-прежнему не подавляет сообщения.

Поскольку эти сообщения появляются в / var / log / messages, LogWatch каждую ночь отправляет ненужные электронные письма.

Хорошо, поскольку мы установили, что ваши диски не плавятся сами по себе из-за того, что вы можете прикоснуться к ним, я бы сказал, что у Джейсона есть правильная идея по настройке LogWatch.
Прошло некоторое время с тех пор, как я смотрел LogWatch (я думаю, что это довольно паршиво и обычно отключает его), но вы определенно можете отключить сигнализацию температуры, используя ignore.conf (в этом вопросе есть некоторая информация об этом, а также в документации LogWatch).


Лучшим решением было бы выяснить, что именно означает указанное значение температуры - очевидно, атрибуты температуры SMART не определены, и даже smartctl страница руководства говорит нелестные вещи о различиях между вендорами и вендорами:

Преобразование необработанного значения в количество в физических единицах не предусмотрено стандартом SMART. В большинстве случаев значения, напечатанные smartctl, разумны. Например, атрибут температуры обычно имеет исходное значение, равное температуре в градусах Цельсия. Однако в некоторых случаях производители используют необычные соглашения. Например, диск Hitachi на моем ноутбуке показывает время работы в минутах, а не в часах. Некоторые диски IBM отслеживают три температуры, а не одну, в их необработанных значениях. И так далее.

Если вы обратитесь к поставщику HD-видео, он сможет дать вам некоторое представление о том, что их диски возвращают для параметра температуры, и вы можете научить LogWatch, когда подавать сигнал тревоги (или оставить LogWatch настроенным на игнорирование мезайнов и реализовать более умная система мониторинга для поиска фактических неисправностей).