Я пытаюсь контролировать контроллер HP Smart Array с помощью nagios. У меня 4 диска на 2 массивах RAID1, поэтому 2 диска на RAID1.
Я установил nrpe-server и nrpe-plugins и использую всемогущий check_raid
plugin, но похоже, что он видит только мой первый массив, а не второй:
# /usr/lib/nagios/plugins/check_raid
OK: cciss:[/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 0 status: OK, /dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 1 status: OK]
cciss_vol_status
сообщает правильно для обоих массивов:
# cciss_vol_status /dev/cciss/c0d0
/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 0 status: OK.
/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 1 status: OK.
# cciss_vol_status /dev/cciss/c0d1
/dev/cciss/c0d1: (Smart Array E200i) RAID 1 Volume 0 status: OK.
/dev/cciss/c0d1: (Smart Array E200i) RAID 1 Volume 1 status: OK.
Как я могу получить check_raid
сообщить по обоим массивам?
Сервер представляет собой HP Proliant DL360 G5 с контроллером Smart Array E200i. В настоящее время он запускает debian wheezy.
Я бы порекомендовал использовать Агенты HP Management and Health для сервера. Они могут отправлять электронную почту, выгружать в системный журнал и отправлять ловушки SNMP.
если ты абсолютно должен сообщить об этом в Nagios, похоже, что есть множество вариантов. Но составной частью набора инструментов HP является hpssacli
или hpacucli
утилита, вывод которой можно было проанализировать:
# hpssacli ctrl all show config
Smart Array P420i in Slot 0 (Embedded) (sn: 001438025AC2EA0)
Internal Drive Cage at Port 1I, Box 2, OK
Internal Drive Cage at Port 2I, Box 0, OK
array A (SAS, Unused Space: 340650 MB)
logicaldrive 1 (72.0 GB, RAID 1, OK)
logicaldrive 2 (600.0 GB, RAID 1, OK)
physicaldrive 1I:2:1 (port 1I:box 2:bay 1, SAS, 900.1 GB, OK)
physicaldrive 1I:2:2 (port 1I:box 2:bay 2, SAS, 900.1 GB, OK)
SEP (Vendor ID PMCSIERA, Model SRCv8x6G) 380 (WWID: 5001438025AC2EAF)
или
# hpssacli ctrl slot=0 ld 1 show status
logicaldrive 1 (72.0 GB, 1): OK
# hpssacli ctrl slot=0 ld 2 show status
logicaldrive 2 (600.0 GB, 1): OK
или, может быть:
# hpssacli ctrl all show config | grep logicaldrive
logicaldrive 1 (72.0 GB, RAID 1, OK)
logicaldrive 2 (600.0 GB, RAID 1, OK)