Несмотря на то, что я довольно много изучаю эту тему в Интернете (честно говоря, я не системный администратор на полный рабочий день), я не могу понять этого.
У нас есть несколько серверов VMWare ESXi 5.5, некоторые из которых интегрированы в vSphere, а некоторые нет (по соображениям стоимости).
Все они запускают стандартный образ ESXi, за исключением одной машины, на которой фактически запущен образ DELL VMWare ESXi.
То, что я хотел бы сделать, кажется простым: настроить систему так, чтобы ее можно было запрашивать через SNMP с удаленного хоста, будь то snmpwalk, Nagios, PRTG и т. Д. Я хотел бы видеть информацию от датчиков температуры, установленных дисков и их статуса , скорость вентилятора, состояние блока питания и т. д.
У меня создалось впечатление, что установка версии VMWare от DELL автоматически активирует необходимые модули (в первую очередь OpenManage), но похоже, что это не так.
У меня есть противоречивая информация о том, возможно ли это вообще, в некоторых документах говорится, что вы не можете запросить сервер DELL VMWare ESXi через SNMP и вам нужно использовать клиент CIM. Затем можно установить OMSA VIB и т. Д.
Я полагаю, что это довольно распространенное требование, но доступные документы тянут его во всех разных направлениях.
Возможно ли то, что я пытаюсь сделать (без полной среды vSphere)?
Да, вы можете контролировать автономный хост ESXi с помощью любого программного обеспечения для мониторинга SNMP, но некоторые элементы могут быть видны только с помощью инструмента мониторинга, поддерживающего протокол CIM.
Все мои хосты ESXi являются частью vCenter, но мы контролируем их напрямую (используя IP-адрес хоста vmkernal) с помощью SolarWinds NPM. В ESXi 5.5 встроено 5 или 6 модулей CIM, которые обеспечивают исправность оборудования, но исправность карты RAID не входит в их число. Вам нужно будет добавить Dell OMSA VIB, который добавляет дополнительных агентов CIM, в том числе агента для массива RAID. Сообщение Брайана Аткинсона по-прежнему остается лучшим, что я нашел, в котором описывается процесс,
https://communities.vmware.com/people/vmroyale/blog/2012/07/26/how-to-use-dell-dset-with-esxi
Вам нужно только следовать инструкциям по установке OMSA ESXi VIB, если вы собираетесь использовать сторонний инструмент мониторинга, который предоставляет историческую информацию и выдает предупреждения. Если вы хотите использовать сервер Dell OMSA, вы можете установить его удаленно на голом сервере, удаленно на виртуальной машине или локально в качестве виртуальной машины.
Вы можете использовать сервер OMSA для подключения к платам управления DRAC и iDRAC Out of Band (OOB / IPMI / iLo) или к хосту ESXi после установки OMSA VIB на хосте ESXi. Вы не увидите информацию о состоянии RAID в DRAC или iDRAC - только при подключении сервера OMSA к хосту ESXi - я повторяю ключевое слово Server, чтобы не было путаницы между сервером, который действует как клиент для OMSA VIB, который установлен на хосте ESXi.
Некоторые полезные ресурсы:
Показать текущих поставщиков CIM на хосте ESXi https://kb.vmware.com/selfservice/microsites/search.do?language=en_US&cmd=displayKC&externalId=2053715
Показать текущие установленные VIB на хосте ESXi из интерфейса командной строки хоста, esxcli software vib list
Вы действительно видите некоторые незначительные дополнительные сведения о состоянии оборудования при подключении к серверу vCenter по сравнению с хостом ESXi напрямую, но, как правило, если вы не видите состояние оборудования, которое вы ищете на панели Configuration / Health Status, то вам не хватает поставщика CIM и вам необходимо найти и установить VIB на хосте ESXi. Когда вы добавляете Dell OMSA VIB к хосту ESXi, вы увидите, что датчик хранилища добавлен на страницу состояния работоспособности, которая показывает тома RAID, диски, контроллер и состояние батареи для вашего контроллера хранилища. Вам может потребоваться сбросить датчики, чтобы он появился, и иногда это занимает от 15 до 20 минут в первый раз после установки VIB и перезагрузки хоста ESXi.
Если вы не видите датчик на странице состояния работоспособности хоста ESXi при подключении к vSphere Client, вы, скорее всего, не увидите его при удаленном опросе датчиков с помощью программного обеспечения для мониторинга.
Также следует отметить, что не все серверы имеют одинаковые датчики, и вы не сможете получить одинаковый статус работоспособности на всех в зависимости от оборудования сервера, карты RAID и версии CIM, доступной для комбинации. Вам также может потребоваться обновить или изменить VIB для карты RAID, чтобы состояние работоспособности работало. Провайдер CIM (в данном случае это OMSA VIB) общается с оборудованием через VIB устройства (настоящий драйвер устройства) и передает эту информацию брокеру CIM на хосте ESXi, также известному как Small Footprint CIM Broker Daemon ( sfcbd). Когда вы опрашиваете хост ESXi на предмет работоспособности оборудования с помощью надежного программного обеспечения для мониторинга, он будет получать некоторую информацию с помощью запросов SNMP, некоторые с использованием CIM, а некоторые с использованием API ESXi (которые являются запросами SOAP). Клиент CIM общается с процессом sfcbd на хосте ESXi.
Иногда процесс CIM просто перестает работать. Когда это произойдет, вы перезапустите процесс sfcbd-watchdog на хосте ESXi. Это перезапустит службу sfcbd, и опрос CIM снова будет работать. Из интерфейса командной строки хоста /etc/init.d/sfcbd-watchdog restart
Я думаю, это покрывает большинство вещей, которые вам нужны для бега.
Я понимаю, что вы ищете; конкретные примечания о том, как управлять и отслеживать работоспособность автономного хоста VMware ESXi.
На практике подход должен быть немного другим. Я объясню, как я управляю хостами.
В ситуации, когда у вас есть несколько хостов ESXi под управлением vCenter, предполагается, что вы использовать vCenter для мониторинга и состояния работоспособности, по сравнению с запросом отдельных хостов. Есть всеобщая тревога которые я настраиваю в vCenter для предупреждения о «Работоспособности оборудования хоста». Обычно меня не волнует источник питания, оперативная память, диск или любой другой компонент, а скорее то, что хост неисправен.
Мониторинг автономного хоста ESXi не будет очень полезным, так как драйверы Dell / HP предназначены для предоставления информации vCenter. И я не считаю, что это лучший способ опрашивать отдельные хосты таким образом. Конечно, это потому, что в идеале вы хотите, чтобы хосты виртуальных машин управлялись централизованно.
Если вы запускаете vCenter с одним хостом, вы получаете эту возможность, так что, возможно, это вариант для вашей среды.
Если вам нужен какой-то внеполосный мониторинг, не могли бы вы вместо этого запросить DRAC?
вы можете использовать отличный https://exchange.nagios.org/directory/Plugins/Operating-Systems/*-Virtual-Environments/VMWare/check_vmware_api/details (с nagios или без), он использует vmware api для получения всей информации, необходимой для мониторинга оборудования:
check_vmware_api -H esxhost -u esx_user_read_only_role -p passwd -l runtime -s health [enter]
OK - All 450 health checks are Green
Вам нужен perl vmware sdk, но в остальном он довольно прост. Это работает для всех типов оборудования (пока датчики видны vmware api, они проверены).
Попробуйте zabbix (http://zabbix.com):
1) это совершенное, известное программное обеспечение для мониторинга мирового класса
2) вы можете легко начать с Zabbix, доступным также в виде предварительно настроенного виртуального образа (на основе OpenSuSE).
3) он может контролировать хосты и машины ESX [I] с помощью веб-служб Vmware (например, веб-клиента). Вы можете использовать правила низкоуровневого обнаружения для автоматического обнаружения гипервизоров и виртуальных машин VMware и создания хостов для их мониторинга на основе заранее определенных прототипов хостов.
4) вы сможете контролировать все оборудование ваших серверов Dell с помощью SNMP через iDrac, включая raid-контроллер и его состояние томов, физические диски / модули памяти / блоки питания и т. Д.
Вся информация о статусе оборудования [как она доступна в iDrac] может быть доступна через SNMP (по крайней мере, на серверах с IDrac 7/8 - я реализовал мониторинг оборудования 50+ серверов Dell 12/13 поколения для моей компании в этом путь).
Благодаря совершенной функции LLD (низкоуровневое обнаружение) в zabbix вы можете легко собрать все аппаратные компоненты для мониторинга без ручного перечисления и автоматически создавать элементы для мониторинга (статусы, температуры, скорости вращения вентиляторов, размеры дисков и серийные номера и т. Д.), Триггеры (выражения для обработки данных мониторинга) и различные действия ...