Назад | Перейти на главную страницу

Как подготовиться к замене сетевой карты с помощью объединения в сеть на узле кластера Windows?

Обновить: Я выполнил обновление. Я использовал наполовину ниндзя, наполовину хакерское решение, подключив адаптеры USB-to-Ethernet, которые я мог добавить к командам для удержания форта. Я подключил по одному на каждую команду, удалил другие затронутые адаптеры в команде, выключил Windows, заменил карту, убедился, что USB-адаптеры находятся в одном USB-порту и будут подключаться таким же образом и загрузились. USB-адаптеры все еще были на месте, и я смог восстановить конфигурацию группы, вручную добавив новые сетевые адаптеры в команды.

Это решение было впервые предложено @ Drifter104 в комментарии. @ shouldbeq931 был первым ответом, предлагающим добавить еще одну карту, чтобы обойти проблему, и получил награду. Оба ответа были полезны, поэтому, честно говоря, я отмечаю исчерпывающий ответ @llorrac, получивший наибольшее количество голосов, как ответ, который указал на важность удаление сетевые карты на сломанной карте от команд перед ее заменой.

Я до сих пор точно не знаю, что произойдет, если вы этого не сделаете, или каковы рекомендации Microsoft по замене карт, но это вина Microsoft, и я ценю помощь, которую я здесь получил.


Исходный вопрос: Я администрирую кластер Windows Server 2012 R2 с рабочими нагрузками Hyper-V. Все узлы кластера имеют несколько сетей, обслуживаемых несколькими физическими сетевыми картами, в которых Windows Server NIC teaming используется для объединения двух портов вместе (команды никогда не объединяют физические сетевые карты). Порт на физической сетевой карте на одном из узлов кластера недавно испытал сбой, и этот порт был удален из группы, и была заказана новая физическая сетевая карта идентичной марки и модели.

Изменить: надеюсь, этот вопрос ответит на общий вопрос «что-то ломается, и если да, то как я могу этого избежать», но я понимаю, что более подробная информация будет полезна, поэтому я их предоставляю.

На сервере всего шесть портов, разделенных на две карты. Одна карта имеет два порта 10 Гбит, а группа охватывает оба порта. Одна карта имеет два порта 10 Гбит и группу, охватывающую оба порта, а также два порта 1 Гбит и группу, охватывающую оба порта. Команда 1 Гбит подключена к нашему общему сетевому коммутатору. Две группы по 10 Гбит / с подключены к нашему серверу хранения и другому узлу кластера по принципу «точка-точка», и вся сеть работает с жестко заданными IP-адресами и без коммутатора. (Это работает но я бы не рекомендовал это и не стал бы повторять это в новой конфигурации. Так что да, я знаю, что это ужасно и предотвращает кучу полезных вещей с VLAN и сетевой гигиеной. Насколько я могу судить, это не влияет на то, о чем я прошу, а именно на то, как объединение сетевых адаптеров Windows Server реагирует на изменение оборудования.) Неисправный порт находится в одной из групп 10 Гбит. Все команды используют командный режим Switch Independent (так как переключателя нет).

Это важный вопрос, и я бы сказал, что это более распространенный сценарий, чем кажется на ваш взгляд.

Как вы, возможно, знаете, MS Server предоставляет три типа объединения. 1. Активный / резервный 2. Статический 3. LACP

На основании вашего заявления о том, придется ли вам

снести все

мне кажется, что вы используете статическое объединение, которое требует большей ручной настройки, чем два других.

По поводу замены NIC.

Независимо от того, какую команду вы используете, вы должны убедиться, что ваш мертвый сетевой адаптер отключен в настройках команды, прежде чем что-либо отключать !!!

Будет ли он подхвачен командой при подключении нового сетевого адаптера? Да, но в зависимости от того, какую конфигурацию вы используете, вам может потребоваться вручную добавить ее в свою команду.

  1. Удалить NIC из команды
  2. Удалить физический сетевой адаптер
  3. Заменить физический сетевой адаптер
  4. Добавить новую сетевую карту в команду

Ознакомьтесь с этим документом из технической сети Microsoft для справки - 4.6 Проверка статуса команды. Есть варианты для редактирования настроек команды визуально или через PowerShell.

По поводу MAC-адреса и кластерных сетей.

Опять же, согласно документации, получатели объединенных данных будут разрешать единственный IP-адрес и опираться на один первичный MAC-адрес из пула. Таким образом, если вы выполните действия, описанные в прилагаемой документации, у вас не должно возникнуть ошибок с конфигурацией MAC-адреса.

В итоге.

Однажды мне пришлось провести анализ после инцидента в похожей ситуации. Инженер планировал отключить переключатель, чтобы заменить его, но не удалил его из бассейна. Это означало, что, когда он выключил коммутатор, весь сетевой трафик был потерян, что привело к воспроизведению ошибок на устройствах конечных пользователей + 250 тыс. ¯_ (ツ) _ / ¯

Ознакомьтесь с документацией - есть еще кое-что, относящееся к Hyper-v, которое может иметь для вас больше смысла.

Windows абстрагирует базовые сетевые адаптеры в группе, когда сетевая карта удаляется из группы, а новая сетевая карта добавляется в команду, команда остается неизменной, пока в команде есть сетевая карта, сохраняется конфигурация группы. Если вы удалите все сетевые карты из команды, команды не останется.

В зависимости от вашей конфигурации, возможностей для периодов обслуживания и свободных слотов PCIe вы можете предпочесть добавить в группу дополнительную сетевую карту перед удалением неисправной сетевой карты.

Я всегда создаю команды из нескольких сетевых адаптеров, чтобы в случае отказа сетевого адаптера команда оставалась работоспособной. Я также склонен создавать команды из разных поставщиков сетевых адаптеров, чтобы в случае развертывания «неисправного» драйвера сетевой карты команда все равно не спала.