Назад | Перейти на главную страницу

Мониторинг HP Smartarray (cciss) с помощью nagios

Я пытаюсь контролировать контроллер HP Smart Array с помощью nagios. У меня 4 диска на 2 массивах RAID1, поэтому 2 диска на RAID1.

Я установил nrpe-server и nrpe-plugins и использую всемогущий check_raid plugin, но похоже, что он видит только мой первый массив, а не второй:

# /usr/lib/nagios/plugins/check_raid
OK: cciss:[/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 0 status: OK, /dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 1 status: OK]

cciss_vol_status сообщает правильно для обоих массивов:

# cciss_vol_status /dev/cciss/c0d0
/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 0 status: OK. 
/dev/cciss/c0d0: (Smart Array E200i) RAID 1 Volume 1 status: OK. 
# cciss_vol_status /dev/cciss/c0d1
/dev/cciss/c0d1: (Smart Array E200i) RAID 1 Volume 0 status: OK. 
/dev/cciss/c0d1: (Smart Array E200i) RAID 1 Volume 1 status: OK. 

Как я могу получить check_raid сообщить по обоим массивам?

Сервер представляет собой HP Proliant DL360 G5 с контроллером Smart Array E200i. В настоящее время он запускает debian wheezy.

Я бы порекомендовал использовать Агенты HP Management and Health для сервера. Они могут отправлять электронную почту, выгружать в системный журнал и отправлять ловушки SNMP.

если ты абсолютно должен сообщить об этом в Nagios, похоже, что есть множество вариантов. Но составной частью набора инструментов HP является hpssacli или hpacucli утилита, вывод которой можно было проанализировать:

# hpssacli ctrl all show config

Smart Array P420i in Slot 0 (Embedded)    (sn: 001438025AC2EA0)

   Internal Drive Cage at Port 1I, Box 2, OK

   Internal Drive Cage at Port 2I, Box 0, OK
   array A (SAS, Unused Space: 340650  MB)

      logicaldrive 1 (72.0 GB, RAID 1, OK)
      logicaldrive 2 (600.0 GB, RAID 1, OK)

      physicaldrive 1I:2:1 (port 1I:box 2:bay 1, SAS, 900.1 GB, OK)
      physicaldrive 1I:2:2 (port 1I:box 2:bay 2, SAS, 900.1 GB, OK)

   SEP (Vendor ID PMCSIERA, Model SRCv8x6G) 380  (WWID: 5001438025AC2EAF)

или

# hpssacli ctrl slot=0 ld 1 show status

   logicaldrive 1 (72.0 GB, 1): OK

# hpssacli ctrl slot=0 ld 2 show status

   logicaldrive 2 (600.0 GB, 1): OK

или, может быть:

# hpssacli ctrl all show config | grep logicaldrive
      logicaldrive 1 (72.0 GB, RAID 1, OK)
      logicaldrive 2 (600.0 GB, RAID 1, OK)