Назад | Перейти на главную страницу

Мониторинг RAID

Есть ли какой-либо инструмент мониторинга Dell H / w base RAID с открытым исходным кодом? Или любой инструмент, который отслеживает отказ жестких дисков в RAID или отказ источника питания на серверах Dell PE.

Конечно. Администратор сервера Dell OpenManage.

как администратор большого количества оборудования dell, я знаю, насколько раздражают инструменты dell openmanage ... (иногда случаются неудачи, они сильно раздуваются, ...)

к счастью, например, raid-контроллеры dell «PERC», используемые в серверах poweredge, являются просто переименованными адаптерами lsi megaraid, и вы можете использовать megacli lsi вместо openmanage: (который по-прежнему является закрытым исходным кодом, но, по крайней мере, менее раздражает или раздражает в разных способами;))

# omreport storage pdisk controller=0 | grep -i state # dell openmanage
State                     : Online
State                     : Online
# MegaCli -PDList -a0 |grep state    # lsi megacli
Firmware state: Online
Firmware state: Online

(не проверяли, правильная ли это версия, она должна быть одинаковой для всех адаптеров, хотя: http://www.lsi.com/storage_home/products_home/internal_raid/megaraid_sas/megaraid_sas_8480e/#Miscellaneous )

Я предполагаю, что вы говорите о Linux. В этом случае посетите Dell OpenManage Wiki по адресу: http://linux.dell.com/wiki/index.php/Repository/hardware

Будьте осторожны, если вы используете OMSA с внешним корпусом стороннего производителя; OMSA действительно будет сообщать и отображать состояние физических дисков, но, по моему опыту, не предупреждение об аппаратных проблемах с самим корпусом ... кажется, это только для JBOD марки Dell.

Однако MegaCli должен работать для этого, например:

[root@ftp1 bin]# MegaCli64 -AdpEventLog -GetEvents -f /tmp/event.log -aALL

Success in AdpEventLog

Exit Code: 0x00
[root@ftp1 bin]# grep Event /tmp/event.log
Adapter: 0 - Number of Events : 13
Event Description: Event log cleared
Event Data:
Event Description: Enclosure PD 1f(c 01/p1) power supply 2 inserted
Event Data:
Event Description: Enclosure PD 1f(c 01/p1) Power supply 2 switched off
Event Data:
Event Description: Enclosure PD 1f(c 01/p1) Power supply 2 cable removed
Event Data:

Smartmontools будет контролировать диски, но насчет контроллера я не уверен. (Мне приходилось отслеживать устройство sg0, а не sda, как описано в документации.)

Диск 0:

smartctl -a -d megaraid,0 /dev/sg0

Диск 1:

smartctl -a -d megaraid,1 /dev/sg0

Я считаю, что это PERC 4.