Я пытаюсь отслеживать статус RAID на моем HP ProLiant DL380 G5 с помощью hpacucli 9.20. Но это ведет себя довольно странно. В большинстве случаев он вернется:
root@SERVER:~# hpacucli ctrl all show
Error: No controllers detected.
Но время от времени это действительно работает так, как задумано:
root@SERVER:~# hpacucli ctrl all show
Smart Array P800 in Slot 4 (sn: PXXXXXXXXX)
Я провел несколько тестов и обнаружил, что он дает сбой примерно в 90-95% случаев, когда я выполнял команду каждую вторую секунду в течение 20 минут (600 выполнений).
У кого-нибудь есть ключ? В чем может быть причина такого странного поведения?
Техническая информация:
Если вы просто хотите отслеживать состояние RAID, выполните hpacucli
сам по себе, поскольку проверка состояния здоровья не является правильным способом. Я тоже мог понять, что это не так. Однако я не могу повторить то же поведение на моих серверах RHEL и CentOS. strace
может быть вам другом в этом случае, так как сбои легко воспроизводятся.
Вы хотите использовать hp-snmp-agents
и hp-health
пакеты для реального непрерывного мониторинга (который предоставляет оповещения по электронной почте и SNMP).
Ubuntu - это своего рода компромисс с серверами HP, поскольку дополнительные инструменты не так хорошо разработаны, как для большего. Операционные системы предприятия.
Пожалуйста, смотрите мои заметки по адресу: Мониторинг дисков / RAID для серверов HP Proliant и Ubuntu 12.04
Похоже, вам понадобится некоторая комбинация программного обеспечения, поставляемого SDR репозиторий подробно на: http://communitylinux.org/node/446#comment-866