Назад | Перейти на главную страницу

Лучший плагин nagios для SMART?

Я пробовал лучший плагин для nagios для мониторинга SMART. Есть такие, но только для контроля температуры. Но с помощью smartctl мы можем найти больше данных. У вас есть плагины получше со всеми данными от смарта?

В плагин check_ide_smart является частью стандартной группы плагинов nagios. Несмотря на «ide» в имени, он использует smartctl для проверки любого диска, поддерживаемого smartctl.

Он может возвращать вывод, подходящий для nagios, например:

$ ./check_ide_smart -n -d /dev/sda
OK - Operational (17/17 tests passed)

Или полный статус SMART:

$ ./check_ide_smart -d /dev/sda
Id=  1, Status=11 {PreFailure , OnLine }, Value=100, Threshold= 16, Passed
Id=  2, Status= 5 {PreFailure , OffLine}, Value=100, Threshold= 50, Passed
Id=  3, Status= 7 {PreFailure , OnLine }, Value=120, Threshold= 24, Passed
Id=  4, Status=18 {Advisory    , OnLine }, Value=100, Threshold=  0, Passed
Id=  5, Status=51 {PreFailure , OnLine }, Value=100, Threshold=  5, Passed
Id=  7, Status=11 {PreFailure , OnLine }, Value=100, Threshold= 67, Passed
Id=  8, Status= 5 {PreFailure , OffLine}, Value=100, Threshold= 20, Passed
Id=  9, Status=18 {Advisory    , OnLine }, Value= 96, Threshold=  0, Passed
Id= 10, Status=19 {PreFailure , OnLine }, Value=100, Threshold= 60, Passed
Id= 12, Status=50 {Advisory    , OnLine }, Value=100, Threshold=  0, Passed
Id=192, Status=50 {Advisory    , OnLine }, Value= 99, Threshold= 50, Passed
Id=193, Status=18 {Advisory    , OnLine }, Value= 99, Threshold= 50, Passed
Id=194, Status= 2 {Advisory    , OnLine }, Value=144, Threshold=  0, Passed
Id=196, Status=50 {Advisory    , OnLine }, Value=100, Threshold=  0, Passed
Id=197, Status=34 {Advisory    , OnLine }, Value=100, Threshold=  0, Passed
Id=198, Status= 8 {Advisory    , OffLine}, Value=100, Threshold=  0, Passed
Id=199, Status=10 {Advisory    , OnLine }, Value=200, Threshold=  0, Passed
OffLineStatus=0 {NeverStarted}, AutoOffLine=No, OffLineTimeout=30 minutes
OffLineCapability=91 {Immediate Auto SuspendOnCmd}
SmartRevision=16, CheckSum=23, SmartCapability=3 {SaveOnStandBy AutoSave}

Я использовал плагин: check_ide_smart; однако в конце концов я обнаружил, что он не уведомляет меня об ошибках в интеллектуальном журнале на диске.

Проблемная ошибка, по-видимому, все еще открыта спустя 5 лет?

# 473 check_ide_smart игнорирует ошибки SMART! http://sourceforge.net/p/nagiosplug/bugs/473/

Теперь я включаю более подробный демон smartd в каждой системе. Затем я получу уведомление от nagios, если этот процесс остановится. Я могу еще раз проверить и перезапустить, если не работает в cron.

Из smartd.conf:

Первый (основной) жесткий диск ATA / IDE. Контролируйте все атрибуты, включите автоматический сбор данных в Интернете, автоматическое автосохранение атрибутов и запускайте короткую самопроверку каждый день между 2–3 часами утра и длительную самопроверку по субботам между 3–4 часами утра. сообщать о необработанных изменениях температуры> = 5 Цельсия


smartd.conf

DEVICESCAN -H -m root -a -o on -S on -s (S /../.././ 02 | L /../../ 6/03) -W 5