Назад | Перейти на главную страницу

Неисправности дисков не регистрируются в HP IML на сервере ProLiant на базе RHEL

Сегодня у меня были диски на двух отдельных серверах HP ProLiant, которые переходили в режим Predictive Failure. Один из этих серверов работает под управлением Windows Server 2008 R2, а другой - под управлением Oracle Enterprise Linux 5 (дистрибутив на основе RHEL5).

Если я посмотрю в журналах интегрированного управления для этих серверов, на сервере Windows есть запись «Внимание», сообщающая о прогнозируемом отказе, но на сервере OEL ее нет.

У нас есть некоторые существующие бизнес-процессы, связанные с IML (интеграция билетов, отчетность и т. Д.), Поэтому мы предпочитаем, чтобы эти сообщения были там. Все навороты звучали для окна Windows, но ничего от сервера OEL.

Я просмотрел историю предупреждений своей системы мониторинга, и она показывает, что так было всегда - сервер Windows сообщает о сбоях диска (прогнозируемых и фактических), а сервер OEL - нет.

Предупреждения о ловушках SNMP работают; они записываются в почтовый файл root и записываются в /var/log/messages файл. Интересно, что IML на сервере OEL делает Кажется, мне показываются Восстановленные записи для предыдущих сбоев диска. Кажется, что в журнале отсутствует только начальная запись «Предупреждение» или «Ошибка».

На сервере Windows установлены все агенты HP Management как часть системы Intelligent Provisioning / Smart Start для установки ОС. На сервере OEL включено репо RHEL5 HP yum и hpsmh, hpilo, hp-health и hp-snmp-agents пакеты установлены.

Сервер Windows - это DL380p Gen8, а сервер OEL - это DL380 G7. У меня нет других поколений серверов, использующих OEL, для сравнения (хотя, похоже, он является общим для трех серверов DL380 G7, на которых я использую OEL). Дальнейшая проверка показывает ошибки дисков, регистрируемые IML на других серверах Windows, по крайней мере, еще в G5 (поэтому я не думаю, что это проблема поколения).

Я также просмотрел сценарии запуска / конфигурации в /opt/hp/hp-snmp-agents/storage/etc/cma* но не вижу ничего, что относится к IML (не то чтобы я действительно знаю, что здесь ищу).

Не удается ли этим сообщениям попасть в IML из-за отсутствия пакета или инструкции конфигурации (т.е. чего-то, что легко исправить)?

Или это известная проблема (не оставляющая мне выбора, кроме как взломать что-то еще в бизнес-процессе)?

Я не думаю, что вам следует полагаться только на журнал HP IML. Там не все сообщается, и журнал можно очистить. Я не рассматриваю это как авторитетный источник информации о состоянии системы. Дополнительные предметы помечаются как отремонтированные, в зависимости от события.

Если вам нужно сравнить, как должен выглядеть загруженный журнал IML системы EL5, посмотреть этот pastebin. Но большинство моих журналов IML в какой-то момент были очищены ... Например:

# hplog -v

ID   Severity       Initial Time      Update Time       Count
-------------------------------------------------------------
0000 Information    03:14  02/26/2014 03:14  02/26/2014 0001
LOG: Maintenance note: IML cleared through hpasmcli

0001 Repaired       20:09  05/07/2014 02:38  09/08/2014 0005
LOG: Network Adapter Link Down (Slot 0, Port 1)

0002 Information    05:29  06/30/2014 05:29  06/30/2014 0001
LOG: Firmware flashed (iLO 4 1.51)

0003 Information    03:07  08/12/2014 03:07  08/12/2014 0001
LOG: Firmware flashed (iLO 4 2.00)

Агенты управления HP в Linux можно легко настроить для отправки ловушек SNMP, а также электронной почты.

Типичный конфиг в /etc/snmp/snmpd.conf:

# Following entries were added by HP Insight Management Agents at
#      Wed Feb 26 03:12:45 PST 2014
dlmod cmaX /usr/lib64/libcmaX64.so
rwcommunity  bigbanana
rocommunity  bigbanana
syscontact Systems <systems@bigbanana.net>
syslocation Anaheim, CA

А для /opt/hp/hp-snmp-agents/cma.conf

########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
#             trapemail /usr/bin/logger
#       will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm - Big Banana' systems@bigbanana.net

Агенты управления HP для Linux должны быть простыми. Вам понадобятся следующие пакеты:

агенты hp-snmp, hpssa, hp-health, hp-smh-templates, hpsmh, hpssacli, hponcfg