Сегодня у меня были диски на двух отдельных серверах HP ProLiant, которые переходили в режим Predictive Failure. Один из этих серверов работает под управлением Windows Server 2008 R2, а другой - под управлением Oracle Enterprise Linux 5 (дистрибутив на основе RHEL5).
Если я посмотрю в журналах интегрированного управления для этих серверов, на сервере Windows есть запись «Внимание», сообщающая о прогнозируемом отказе, но на сервере OEL ее нет.
У нас есть некоторые существующие бизнес-процессы, связанные с IML (интеграция билетов, отчетность и т. Д.), Поэтому мы предпочитаем, чтобы эти сообщения были там. Все навороты звучали для окна Windows, но ничего от сервера OEL.
Я просмотрел историю предупреждений своей системы мониторинга, и она показывает, что так было всегда - сервер Windows сообщает о сбоях диска (прогнозируемых и фактических), а сервер OEL - нет.
Предупреждения о ловушках SNMP работают; они записываются в почтовый файл root и записываются в /var/log/messages
файл. Интересно, что IML на сервере OEL делает Кажется, мне показываются Восстановленные записи для предыдущих сбоев диска. Кажется, что в журнале отсутствует только начальная запись «Предупреждение» или «Ошибка».
На сервере Windows установлены все агенты HP Management как часть системы Intelligent Provisioning / Smart Start для установки ОС. На сервере OEL включено репо RHEL5 HP yum и hpsmh
, hpilo
, hp-health
и hp-snmp-agents
пакеты установлены.
Сервер Windows - это DL380p Gen8, а сервер OEL - это DL380 G7. У меня нет других поколений серверов, использующих OEL, для сравнения (хотя, похоже, он является общим для трех серверов DL380 G7, на которых я использую OEL). Дальнейшая проверка показывает ошибки дисков, регистрируемые IML на других серверах Windows, по крайней мере, еще в G5 (поэтому я не думаю, что это проблема поколения).
Я также просмотрел сценарии запуска / конфигурации в /opt/hp/hp-snmp-agents/storage/etc/cma*
но не вижу ничего, что относится к IML (не то чтобы я действительно знаю, что здесь ищу).
Не удается ли этим сообщениям попасть в IML из-за отсутствия пакета или инструкции конфигурации (т.е. чего-то, что легко исправить)?
Или это известная проблема (не оставляющая мне выбора, кроме как взломать что-то еще в бизнес-процессе)?
Я не думаю, что вам следует полагаться только на журнал HP IML. Там не все сообщается, и журнал можно очистить. Я не рассматриваю это как авторитетный источник информации о состоянии системы. Дополнительные предметы помечаются как отремонтированные, в зависимости от события.
Если вам нужно сравнить, как должен выглядеть загруженный журнал IML системы EL5, посмотреть этот pastebin. Но большинство моих журналов IML в какой-то момент были очищены ... Например:
# hplog -v
ID Severity Initial Time Update Time Count
-------------------------------------------------------------
0000 Information 03:14 02/26/2014 03:14 02/26/2014 0001
LOG: Maintenance note: IML cleared through hpasmcli
0001 Repaired 20:09 05/07/2014 02:38 09/08/2014 0005
LOG: Network Adapter Link Down (Slot 0, Port 1)
0002 Information 05:29 06/30/2014 05:29 06/30/2014 0001
LOG: Firmware flashed (iLO 4 1.51)
0003 Information 03:07 08/12/2014 03:07 08/12/2014 0001
LOG: Firmware flashed (iLO 4 2.00)
Агенты управления HP в Linux можно легко настроить для отправки ловушек SNMP, а также электронной почты.
Типичный конфиг в /etc/snmp/snmpd.conf:
# Following entries were added by HP Insight Management Agents at
# Wed Feb 26 03:12:45 PST 2014
dlmod cmaX /usr/lib64/libcmaX64.so
rwcommunity bigbanana
rocommunity bigbanana
syscontact Systems <systems@bigbanana.net>
syslocation Anaheim, CA
А для /opt/hp/hp-snmp-agents/cma.conf
########################################################################
# trapemail is used for configuring email command(s) which will be
# executed whenever a SNMP trap is generated.
# Multiple trapemail lines are allowed.
# Note: any command that reads standard input can be used. For example:
# trapemail /usr/bin/logger
# will log trap messages into system log (/var/log/messages).
########################################################################
trapemail /bin/mail -s 'HP Insight Management Agents Trap Alarm - Big Banana' systems@bigbanana.net
Агенты управления HP для Linux должны быть простыми. Вам понадобятся следующие пакеты:
агенты hp-snmp, hpssa, hp-health, hp-smh-templates, hpsmh, hpssacli, hponcfg