Вчера вечером мы получили уведомление от vCenter, в котором говорилось, что ему не удалось подключиться к агенту на одном из наших хостов, а также что «Состояние хоста и питания» было ошибочным, и сервер был отключен.
Проблем с запуском гостей на хосте не было, поэтому мы оставили его на утро.
Но при проверке журналов задач и событий и предупреждений мы ничего не находим. Журналы хоста также не показывают проблем в это время.
Никаких ссылок на то, что что-то пошло не так, не к чему привязать это уведомление.
Даже если проблема была временной и была устранена сама собой, не должно ли быть что-то в журнале, указывающее на возникновение какой-либо проблемы?
Кроме того, если оно на самом деле восстановилось автоматически, почему vCenter не отправил обычное уведомление «О, привет, все в порядке, нао» при восстановлении системы?
Что касается предупреждения об исчезновении сигнала тревоги, вам необходимо изменить определение сигнала тревоги, чтобы уведомление запускалось при изменении состояния «на зеленый», а не при изменении состояния по умолчанию, которое срабатывает, когда состояние изменяется на что-либо «с зеленого». Сделать это:
Вот столбец, который вам нужно настроить:
Что касается отключений, вы используете ESXi или ESX? Ведение журнала ESXi выполняется очень быстро (особенно сообщения), поэтому вы не сможете вернуться достаточно далеко назад, чтобы увидеть информацию о разъединении. Если это так, вы можете исправить это, настроив хост для входа на внешний сервер системного журнала. Недавно мы наблюдали проблемы с отключением хоста по странным причинам, в первую очередь из-за того, что устройство контрольной точки между хостом и vcenter вмешивалось в порядок пакетов (через свою интеллектуальную IDS) и заставляло хосты регулярно переходить в неуправляемое состояние, пока мы не перезапустили услуги управления. Есть ли между хостами и vcenter какие-либо каналы WAN или межсетевые экраны?