У меня есть Dell PowerEdge T710 со встроенным RAID-контроллером PERC H700. Я использую два 500-гигабайтных жестких диска с машины в зеркальном рейде. Вся машина работает под управлением VMWare ESXI 4, и я получаю доступ к машине через Vsphere.
Он работает круглосуточно и без выходных, и мне было интересно, как мне узнать, что зеркальный RAID-массив не работает, и мне нужно заменить его на новый диск ?!
Спасибо за любую помощь в этом вопросе новичка.
ESXi на полностью поддерживаемом оборудовании от любого из основных поставщиков будет генерировать предупреждения контроллера RAID, видимые в VI CLient. Поскольку H700 на HCL Я был бы очень удивлен, если бы он не выдавал предупреждений, как и старые карты PERC6, иногда точка раздражения. Было бы неплохо, если бы VMware (или кто-либо другой) предоставил бы исчерпывающий список того, какой уровень отчетов о сбоях может обеспечить их встроенный мониторинг состояния оборудования для каждого устройства, но это не то, что мне когда-либо удавалось найти.
Было бы намного проще выяснить, поддерживает ли ESXi SNMP, но, к сожалению, это не так, вам нужно использовать WBEM \ CIM, который не так просто включить и с ним взаимодействовать. Сценарий Nagios \ Python, упомянутый в моем ответе на этот связанный вопрос может дать вам лучшую информацию, если вы сможете заставить ее работать.
У Dell есть достаточно полезный документ здесь о различных шагах, которые вы можете предпринять для включения более расширенного мониторинга с помощью агента Open Manage Server Administrator в ESX и ESXi V4 \ 4.1, который вы можете выполнить, если хотите полностью включить удаленный мониторинг на своих хостах ESXi. Даже при этом вы ограничены ловушками CIM \ WBEM и SNMP, запросы SNMP не работают на ESXi.
Вы можете установить OpenManage Server Administrator на хосте ESX и использовать его для мониторинга системы и предупреждения вас в случае сбоя диска.
Здесь есть руководство по установке: http://support.dell.com/support/edocs/software/smsom/6.2/en/omsa_ig/html/instesxi.htm#wp10982текст ссылки85
Очень похожий вопрос есть в ответах на Мониторинг аппаратного RAID на VMWare ESXi
Для R710 с продуктами VMware мне нравится использовать программное обеспечение Dell, чтобы предупредить меня. Вы установите Dell OpenManage, настроите сигналы тревоги, дадите DRAC и IP-адрес, отправите сообщения на ваш smtp-сервер / желаемую почтовую группу / отдельному лицу. Таким образом, если у вас есть какой-либо аппаратный сбой, OpenManage будет знать, потому что это его работа, тогда DRAC отправит почту, потому что почти в худшем случае сервер не работает, но DRAC все еще имеет питание и может предупреждать.
1) Перейдите на сайт support.dell.com. Выберите R710 в качестве своей системы или введите метку обслуживания. Выберите свою ОС в раскрывающемся списке. Загрузите системный администратор Dell OpenManage (автономный). 2) Установите путем монтирования ISO из vCenter или создайте физический диск и подключитесь к DVD-приводу в vCenter 3) Выполните экспресс-установку. Возможно, вам придется перезапустить службы esx mgt и / или службы dell. 4) Подключитесь к OpenMange через браузер https: // ваш IP-адрес сервера или DNS-имя: 1311 5) Настройте Openmange (настройка сигналов тревоги, настройка SMTP-сервера) 6) Настройте DRAC в OpenManage - дайте ему IP-адрес и измените пароль по умолчанию / root 4) Подключитесь к стороне DRAC в веб-браузере и проверьте конфигурацию.
Оповещения теперь будут выходить из коробки с вашего IP-адреса DRAC. После того, как вся почта настроена, проведите тест, вытащив 1 кабель питания и снова подключив его. Вы должны увидеть 4 сообщения электронной почты, вышедших из коробки (избыточность питания снижена, избыточность питания потеряна, затем она возвращается) - просто простой тест, чтобы убедиться, что вы получаете почту.
Вы можете получить немного информации о хранилище RAID из самого vSphere API. Попробуйте vSphere API, но с устройства RAID будет получаться только ограниченная информация.