Есть ли какой-либо инструмент мониторинга Dell H / w base RAID с открытым исходным кодом? Или любой инструмент, который отслеживает отказ жестких дисков в RAID или отказ источника питания на серверах Dell PE.
Конечно. Администратор сервера Dell OpenManage.
как администратор большого количества оборудования dell, я знаю, насколько раздражают инструменты dell openmanage ... (иногда случаются неудачи, они сильно раздуваются, ...)
к счастью, например, raid-контроллеры dell «PERC», используемые в серверах poweredge, являются просто переименованными адаптерами lsi megaraid, и вы можете использовать megacli lsi вместо openmanage: (который по-прежнему является закрытым исходным кодом, но, по крайней мере, менее раздражает или раздражает в разных способами;))
# omreport storage pdisk controller=0 | grep -i state # dell openmanage
State : Online
State : Online
# MegaCli -PDList -a0 |grep state # lsi megacli
Firmware state: Online
Firmware state: Online
(не проверяли, правильная ли это версия, она должна быть одинаковой для всех адаптеров, хотя: http://www.lsi.com/storage_home/products_home/internal_raid/megaraid_sas/megaraid_sas_8480e/#Miscellaneous )
Я предполагаю, что вы говорите о Linux. В этом случае посетите Dell OpenManage Wiki по адресу: http://linux.dell.com/wiki/index.php/Repository/hardware
Будьте осторожны, если вы используете OMSA с внешним корпусом стороннего производителя; OMSA действительно будет сообщать и отображать состояние физических дисков, но, по моему опыту, не предупреждение об аппаратных проблемах с самим корпусом ... кажется, это только для JBOD марки Dell.
Однако MegaCli должен работать для этого, например:
[root@ftp1 bin]# MegaCli64 -AdpEventLog -GetEvents -f /tmp/event.log -aALL
Success in AdpEventLog
Exit Code: 0x00
[root@ftp1 bin]# grep Event /tmp/event.log
Adapter: 0 - Number of Events : 13
Event Description: Event log cleared
Event Data:
Event Description: Enclosure PD 1f(c 01/p1) power supply 2 inserted
Event Data:
Event Description: Enclosure PD 1f(c 01/p1) Power supply 2 switched off
Event Data:
Event Description: Enclosure PD 1f(c 01/p1) Power supply 2 cable removed
Event Data:
Smartmontools будет контролировать диски, но насчет контроллера я не уверен. (Мне приходилось отслеживать устройство sg0, а не sda, как описано в документации.)
Диск 0:
smartctl -a -d megaraid,0 /dev/sg0
Диск 1:
smartctl -a -d megaraid,1 /dev/sg0
Я считаю, что это PERC 4.