Назад | Перейти на главную страницу

Мониторинг работоспособности сервера ESXi

Как заявила VMware, сейчас самое время! Я начал читать и планировать наше обновление с vSphere ESX 4.0 до vSphere ESXi 4.1. Хотя я знаю, что vSphere 5 должна выйти осенью этого года, я почти уверен, что это первоначальное планирование применимо и к этой версии. Одна из моих основных проблем заключается в том, что я хочу иметь возможность эффективно контролировать состояние здоровья наших хостов. Мой вопрос состоит из двух частей: 1) Должна ли моя текущая настройка работать, 2) Какие еще предложения?

Моя текущая настройка для мониторинга состояния наших серверов и предупреждений о сбоях представляет собой комбинацию iDRAC6 оповещение и WUG (Whats Up Gold) перехват ловушек SNMP. IDRAC6 может отправлять на SMTP-сервер и отправлять электронную почту, если что-то физическое, за исключением событий хранения, ухудшается или выходит из строя на сервере. Серверы также настроены для отправки ловушек SNMP в WUG, который отслеживает события хранилища и является вторичным уведомлением о других событиях. Чтобы получить эту настройку, я редактирую файлы SNMPD.CONF через сервисную консоль, что, конечно же, исчезает. Похоже, новый способ сделать это, если я попытаюсь продолжить, подробно описан в этом КБ VMware. Кто-нибудь использует настройку ловушек SNMP для мониторинга своего оборудования и выполнил описанную настройку?

Вторая часть моего вопроса: может быть лучший способ контролировать состояние моих хостов? Я знаю, что есть и другие методы, но, не споря, каковы другие способы, которые могут быть даже лучше, для мониторинга состояния здоровья хостов? Я смотрел на CIM, но я не уверен, что находится на другом конце и интерпретирует то, что CIM говорит неправильно. Какие методы используют все остальные для получения этих данных?

Я использую данные, поступающие из (i) DRAC, в сочетании с данными, которые ESXi собирает через CIM, с vCenter, настроенным для предупреждения о сбоях, возникающих в результате мониторинга CIM.

Мне немного непонятно, что вы говорите о надежности данных CIM, но я лично доверяю им намного больше, чем я бы доверял ловушкам SNMP, отправляемым в WhatsUp. CIM будет улавливать и выдавать предупреждения о таких незначительных вещах, как низкое напряжение батареи BIOS, если ваше оборудование хорошо поддерживается (как и недавнее оборудование Dell), а vCenter довольно гибок в выборе того, что, куда и как часто вы бросаете. предупреждения об этих событиях.

Если ваши хосты - Dell, я очень рекомендую посмотреть Подключаемый модуль Dell Management для vCenter. Это очень хорошо сделанный инструмент, который позволяет получать в рамках vCenter множество предупреждений об оборудовании, которые иначе вы бы не получили. Это не бесплатный продукт, но цена разумная, а результаты того стоят.

Видеть: VMWare vSphere и переход с ESX на ESXi

Что касается вопроса о мониторинге, я предполагаю, что большинство из них занимается мониторингом систем, используя специально созданные версии ESXi для соответствующего оборудования и отслеживая ловушки из Virtual Center.