У нас есть VMware ESXi на нескольких серверах, как мы можем удаленно отслеживать проблемы с жесткими дисками, оперативной памятью, блоком питания или сетевыми картами?
Вы не упоминаете, какой марки / модели ваши серверы, но если они находятся в HCL, тогда будут встроены некоторые аппаратные предупреждения, за которыми вы можете следить через VSClient или через vCenter. Некоторые производители имеют расширенные драйверы аппаратных предупреждений, которые они могут предоставить вам (часто в специально созданном установщике для ESXi), которые могут предоставить вам гораздо более подробную информацию.
Если на вашем сервере есть какое-то удаленное управление, вы можете использовать его, также вы можете использовать функцию SNMP ESXi, если у вас есть соответствующая лицензия. Если вы работаете на более новых серверах dell, idrac отлично подходит.
Если у вас работает HP, вы всегда можете использовать Insight Manager.
я использую pysphere http://code.google.com/p/pysphere/ с zabbix и отлично работает
пример:
for h in props.runtime.healthSystemRuntime.systemHealthInfo.numericSensorInfo:
print h.name
print h.currentReading
self.server.disconnect()
worked like charm...
System Board 9 Power Meter - Device enabled
44800
System Board 7 Temp 25 - Normal
4600
System Internal Expansion Board 13 Temp 24 - Normal
8300
System Internal Expansion Board 12 Temp 23 - Normal
7900
Power Domain 1 Temp 22 - Normal
300
Processor 3 Temp 21 - Normal
В настоящее время я использую HPSIM с HPServers, и есть небольшой приятный плагин для VCenter, который позволит вам видеть актуальную информацию о температуре, скорости вращения вентиляторов, состоянии питания и т. Д., И все это из VCenter.
SIM-карта также отправляет электронные письма или предупреждения при обнаружении проблемы. Например, когда возникает проблема с вентилятором блока питания или температура в зоне повышается, SIM-карта пришлет мне электронное письмо.
Я не пробовал, но вы должны иметь возможность настроить что-то подобное с помощью раздела Alarms / Definitions / Actions в VCenter.
Поскольку мы в значительной степени (почти полностью!) Магазин HP, я не могу говорить с другими поставщиками оборудования. Однако мы только что получили Dell M1000e и несколько блейд-серверов, поэтому я надеюсь узнать больше об управлении и мониторинге этого оборудования в ближайшее время.
Вы также можете использовать CIM для мониторинга ESX и ESXi. Видеть: http://blogs.vmware.com/esxi/2010/04/hardware-health-monitoring-via-cim.html