Я покупаю Dell R610 с резервными блоками питания. Как лучше всего получить предупреждение в случае отказа одного из блоков питания? Я буду работать под управлением Windows Server 2008 R2. Поскольку эта машина будет находиться на объекте размещения, я не услышу сигнала тревоги.
Dell OpenManage создает события в журнале событий при обнаружении проблем с блоком питания. Для уведомления можно использовать любое программное обеспечение, способное обнаруживать определенные события в журнале событий. Вы также можете настроить действия предупреждений для запуска программы по вашему выбору, которая, как я полагаю, может быть электронной почтой и т. Д.
Я считаю, что уведомления встроены в компонент ИТ-помощника Dell OpenManage, но это многокомпонентный пакет, и я не уверен, входит ли он в базовую часть, поскольку мы используем Microsoft System Center Operations Manager для уведомлений, что, очевидно, является избыточным для один сервер в объекте Colo. IT Assistant необходимо будет запустить в отдельной системе IIRC. В зависимости от объекта colo, у них может быть настроен IT Assistant, к которому вы можете подключиться для получения предупреждений.
ipmitool может проверять источники питания. Я делаю это в основном на машинах с Linux, но ipmitool существует и для Windows.
# ipmitool sdr type "Power Supply"
Status | 64h | ok | 10.1 | Presence detected
Status | 65h | ok | 10.2 | Presence detected
PS Redundancy | 74h | ok | 7.1 | Fully Redundant
Просто напишите сценарий для анализа вывода и отправьте его на центральный узел мониторинга (или отправьте его вам по электронной почте).
Вы можете взглянуть на Nagios.
Если вы хотите контролировать только источник питания, это было бы излишним.
Однако его настройка позволит вам отслеживать любые предупреждения, генерируемые OpenManage, такие как сбой рейда, проблемы с памятью, вентиляторы шасси и т. Д., Поскольку есть плагин Nagios, который запрашивает OpenManage.
Кроме того, вы можете отслеживать чрезмерное использование оперативной памяти, заполнение жестких дисков, процент использования процессора и т. Д.
Вы также можете отслеживать службы, которые вы предоставляете в этом поле, например HTTP, SMTP, FTP и т. Д.
Для настройки лучше всего использовать отдельную коробку и, если она находится вне оборудования, которое вы контролируете, чтобы вы могли получать предупреждения во время простоя. Он не требует большого количества энергии и легко может быть более старой коробкой, стоящей в вашем офисе или дома.
Вы можете настроить оповещения на электронную почту, мобильные телефоны, плагины firefox и т. Д. Вы можете настроить группы эскалации так, чтобы они сначала отправлялись на электронную почту, если она не адресуется, затем отправляет текстовое сообщение парню №1, еще не адресованному текстовому парню №2 и т. Д.
В основном, то, что вы можете делать с Nagios, довольно глубокое и является отличным инструментом для любого системного администратора.
Если вы ищете решение для мониторинга, которое не зависит от самого R610, вы можете использовать такой продукт, как ITWatchСобакиWeatherGoose-II в паре с парой трансформаторов тока CT-30-60-120, по одному трансформатору для каждого из двух разъемов питания переменного тока на задней панели сервера. Затем, если один из источников питания откажет, его текущее потребление упадет до нуля (или близко к нему), и вы можете настроить WeatherGoose-II на отправку электронной почты или прерывания SNMP, когда это произойдет.
Однако вам нужно будет попросить электрика вскрыть шнур питания и отделить токоведущий «горячий» провод от тройки внутри шнура питания, чтобы он мог сам пройти через центр трансформатора; если вы просто зажмете ТТ вокруг всего шнура питания, противоположные токи в горячем и нейтральном проводах нейтрализуют магнитное поле друг друга, и ТТ всегда будет «видеть» нулевое потребление тока.
Другой возможный вариант - RCU-H (который производится другим филиалом материнской компании IT Watchdogs, но по-прежнему должен быть доступен через них), который по сути представляет собой «умный» удлинитель для монтажа в стойку, который может индивидуально контролировать и контролировать каждый торговая точка. Просто подключите оба шнура питания от сервера Dell к двум гнездам на RCU-H, и он также может отслеживать потребление тока каждым из них и предупреждать вас, если какой-либо блок питания внезапно прекращает потребление тока.