Назад | Перейти на главную страницу

Почему моя виртуальная машина HyperV случайно теряет подключение?

У меня странная периодически возникающая проблема с подключением каждые две недели.

Сначала моя конфигурация: я запускаю отказоустойчивый кластер HyperV с двумя физическими хостами (node01 и node02). Оба хоста работают под управлением сервера Windows Server 2008 R2 HyperV (бесплатный) с пакетом обновления 1 (SP1). На этих хостах я использую две виртуальные машины, каждая из которых работает под управлением веб-версии Windows Server 2008 R2 с пакетом обновления 1 (SP1). Мой сервер хранения - это Windows Storage Server 2008, подключенный через iSCSI. На обоих хостах и ​​на сервере хранения установлены последние сетевые драйверы, загруженные непосредственно с веб-сайта Intel.

Вот проблема: в 99,99% случаев все работает отлично. Примерно раз в две-три недели виртуальные машины одновременно теряют сетевое подключение, как входящее, так и исходящее. Когда это произойдет,

  1. Я не могу использовать RDP ни в одну из виртуальных машин.
  2. Я могу подключиться по RDP к любому хосту.
  3. Я могу подключиться к любой виртуальной машине из диспетчера отказоустойчивого кластера, щелкнув правой кнопкой мыши узел и выбрав «Подключиться к виртуальной машине».
  4. После подключения к виртуальной машине, как описано в пункте 3 выше, я не могу получить доступ к каким-либо веб-сайтам или машинам в локальной сети. Отключение и повторное включение виртуального сетевого подключения внутри виртуальной машины не решает проблему.
  5. Если я перенесу виртуальную машину на другой узел, это решит проблему (на следующие две недели).
  6. Если я перезагружу хост и верну на него виртуальную машину, это решит проблему (на следующие две недели).
  7. Когда это происходит, отказоустойчивый кластер НЕ выполняет автоматическое переключение виртуальной машины.
  8. Ни на одном из узлов или виртуальных машин нет необычных записей журнала событий.

Это происходило около 5 раз с теми же симптомами, что описаны выше. Я подозреваю, что проблема связана с сетевым драйвером или сетевым оборудованием, но поскольку я уже использую последние версии драйверов, я не знаю, что с этим делать.

Это настоящая головоломка ... есть идеи?

Обновить

Я нашел здесь очень похожий случай: Virutal Machine теряет сетевое подключение в кластере Hyper V

Обновление 29.07.2011

После установки исправлений и обновления сетевых драйверов у меня все еще возникает та же проблема. В ответ на комментарий с просьбой предоставить подробную информацию об аппаратном обеспечении, сервер представляет собой Intel SR1670HV, который представляет собой шасси высотой 1U, содержащее две независимые материнские платы S5500HV. Связь осуществляется через встроенные сетевые адаптеры материнской платы Intel 82574L. Сетевой драйвер - версия 16.2.49.0.

У нас была такая проблема там, где я нахожусь. Я не помню точных деталей, но окончательное решение было связано с конфликтующим MAC-адресом, динамически назначаемым виртуальному сетевому адаптеру. Придавить их, чтобы они не были динамическими, очень помогло. Обычно вы не хотите этого делать, потому что это может затруднить перемещение виртуальной машины на другой хост, но в этом случае нам это помогло.

Другая часть заключается в том, что физические сетевые адаптеры были сделаны Broadcom, и у нас также была ошибка конфигурации, когда предыдущий администратор неправильно пытался использовать утилиту Broadcom для объединения двух сетевых адаптеров на хосте для улучшения полосы пропускания / пропускной способности. Мы удалили эту настройку и настроили один из сетевых адаптеров так, чтобы у него вообще не было IP-адреса на хост-машине, но его можно было использовать для сквозной передачи виртуальным гостям. Затем мы настраиваем каждую виртуальную машину на использование только одного или другого узла, балансируя нагрузку на основе исторического трафика. Конечно, это означает отсутствие аварийного переключения при выходе из строя адаптера или соединения, и мы плохо проследили за тем, чтобы трафик оставался сбалансированным с течением времени, но с тех пор он был очень стабильным.

Я знаю, что это старый вопрос, но я столкнулся с той же проблемой и потратил столько времени на ее решение, что подумал, что поделюсь решением, которое сработало для меня. Я нашел решение своей проблемы здесь:

http://invendows.wordpress.com/2008/03/06/network-issue-with-hyper-v/

В моей ситуации решением было отключить разгрузку TCP на виртуальных машинах. Процитирую соответствующий раздел по ссылке:

Чтобы отключить разгрузку TCP, мне пришлось создать и установить новое значение реестра в каждой виртуальной машине, подключенной к сетевой карте Broadcom 8507 Nextreme II.

Я использовал следующее изменение реестра, чтобы отключить разгрузку TCP:

Ключ: HKLM \ SYSTEM \ CurrentControlSet \ Services \ Tcpip \ Parameters

Значение (DWORD): DisableTaskOffload = 1

После отключения разгрузки TCP на каждой виртуальной машине все проблемы исчезли, и я смог подключить несколько виртуальных машин к одному порту сетевого адаптера Broadcom 5708 Nextreme II.

На моем сервере Broadcom NetExtreme Сетевые адаптеры, поэтому мне кажется, что причина этой проблемы определенно связана с драйвером, но настройка DisableTaskOffload = 1 полностью решил проблему для меня. Надеюсь, что эта информация сэкономит кому-то еще часы поиска!

Я столкнулся с чем-то похожим в гораздо более простой среде Hyper-V и наткнулся на эту статью в Microsoft. Кажется, это соответствует вашей ситуации, если веб-серверы интенсивно используются.

http://support.microsoft.com/kb/974909 - Сетевое соединение работающей виртуальной машины Hyper-V теряется из-за интенсивного исходящего сетевого трафика на компьютере под управлением Windows Server 2008 R2.

Оказалось, что это проблема с оборудованием - я изолировал проблему от управляемого коммутатора Netgear GSM7224v2, заменил его на D-Link DGS-1024D, и с тех пор все работает нормально.

В качестве «извлеченного урока» в этом случае я, вероятно, потратил 99% своих усилий по диагностике на устранение неполадок в настройках программного обеспечения для того, что оказалось проблемой оборудования. Я даже заплатил службе поддержки Microsoft 259 долларов (и провел с ними много времени по телефону), чтобы помочь мне разобраться в настройках программного обеспечения. Я полагаю, что мораль этой истории в том, чтобы подозревать ваше оборудование так же, как и ваше программное обеспечение.

У нас была такая же проблема, но в нашем случае каждые 24-48 часов. Я бы дважды проверил, что ваш антивирус / брандмауэр специально поддерживает Server 2008 с Hyper-V, если нет, попробуйте другой (или временно удалите, если это возможно) ваш антивирусный продукт / брандмауэр в качестве теста, чтобы увидеть, исчезнет ли проблема. .

После звонка в Microsoft и нескольких загрузок файлов дампа / журнала позже они определили, что в нашем случае виноват TrendMicro OfficeScan. Мы использовали версию, которая явно не поддерживалась в Hyper-V, и после обновления до последней версии проблема исчезла.

Отключили ли вы в свойствах сетевого адаптера для гостевой виртуальной машины Jumbo Packets и Large Send Offload? Основываясь на моем опыте работы с этими настройками, я обязательно попробую.

https://support.microsoft.com/en-us/kb/2986895

Это известная проблема с сетевыми адаптерами Broadcom на 1 гигабайт.