У меня есть блок RHEL с напрямую подключенным хранилищем (Dell Powervault 1200), содержащий 10 дисков в RAID 10. На сервере настроены два логических тома. Интересно, как по операционной системе определить работоспособность дисков. Как я могу определить, находится ли диск в деградированном режиме операционной системы? Есть ли инструменты, которые Dell предоставляет для мониторинга дисков?
Как MD1200 подключен к серверу - Dell PERC (5e / 6e / H800) или аналогичная карта RAID, или это SAS HBA (и программный RAID)?
Если он использует контроллер RAID, программное обеспечение для управления, которое поставляется с ним, должно обрабатывать уведомления о состоянии диска. (Для карты Dell это часть OpenManage Server Administrator - хотя я не пробовал использовать это в хост-системе, отличной от Dell).
Вы также можете использовать такие утилиты, как smartmontools, напрямую с множество RAID-контроллеров (включая PERC), как и в случае с SAS HBA, который представляет диски индивидуально. Существуют плагины Nagios, которые взаимодействуют с инструментами MegaCLI (для карт на основе LSI, таких как PERC) - и аналогичные для других карт - которые также извлекают информацию о состоянии здоровья.
Если вы работаете в поддерживаемой конфигурации, вы почти гарантированно сможете отслеживать это с помощью Open Manage Server Administrator. Вы можете видеть статус RAID LUN, состояние отдельного диска и даже экспортировать журналы модуля RAID-контроллера для просмотра истории ошибок и событий.
OMSA 7.2 для RHEL 6: http://ftp.us.dell.com/FOLDER01184959M/1/OM-SrvAdmin-Dell-Web-LX-7.2.0-6945.RHEL6.x86_64.tar.gz
OMSA 7.2 для RHEL 5: http://ftp.us.dell.com/FOLDER01184956M/1/OM-SrvAdmin-Dell-Web-LX-7.2.0-6945.RHEL5.x86_64.tar.gz
Другие версии доступны здесь: http://ftp.us.dell.com/Pages/Drivers/poweredge-r710.html