Я установил 2-узловой кластер vSphere. Каждый узел оснащен 4 сетевыми адаптерами 1GE. Я установил по одному vSwitch на каждом узле, используя все 4 vmnics в качестве адаптеров и следующие порты:
Управление: порт vmKernel -> Активный на vmnic0, Standby на vmnic1-2-3
vMotion и FT -> Активно на vmnic3, в режиме ожидания на vmnic0-1-2
Рабочая нагрузка -> Активно на vmnic0-1-2-3
Маршрут на основе исходного виртуального порта.
Я знаю, что это решение не идеально, поскольку передовой опыт предполагает наличие физически разделенной сети для vMotion / FT, но все же.
Я заметил, что виртуальная машина не привязана к vmnic3, поэтому, похоже, это используется только vMotion / FT.
Однако, когда FT включен (на фиктивной машине WinServer ничего не делает), я замечаю следующие проблемы:
1) эхо-запросы к / от этой машины нестабильны (до 5 мс)
2) собирая статистику на физическом коммутаторе, я заметил, что порт, физически подключенный к vMotion / FT NIC, имеет скорость ввода 300 Мбит / с (что ожидается), но я также заметил, что скорость вывода всех портов, подключенных к другим vmnics, составляет 300 Мбит / с, как физический коммутатор наводняет трафик FT на все другие порты. При отключении FT трафик возвращается к небольшим значениям на всех сетевых адаптерах.
Почему пункты 1 и 2 выше?
РЕДАКТИРОВАТЬ: Все порты находятся в одной VLAN. Я знаю, что это далеко от идеала, но до сих пор не могу объяснить пункты 1 и 2 выше.
Трафик называется "одноадресное наводнение" и это происходит, когда коммутатор не уверен, куда направить пакеты.
Существует известная проблема с одноадресной лавинной рассылкой, возникающая, когда порты vMotion не изолированы в своей собственной VLAN. VMware не так ясно понимает это, как следовало бы, и здесь есть хорошая запись в блоге: http://virtuallyhyper.com/2012/03/vmotion-causes-unicast-flooding/.
Вы можете назначить сетевые адаптеры службам, но вы должны использовать выделенную VLAN для трафика vMotion. Для этого ваши коммутаторы должны быть магистральными портами.
Недостаточно пропускной способности для отказоустойчивости. VMware рекомендует ссылки со скоростью не менее 10 Гбит / с. В лабораторных условиях даже виртуальной машине с двумя виртуальными ЦП в некоторых сценариях требуется около 2,5 Гбит / с только для FT. Это то, что требуется для воспроизведения скорости изменения ОЗУ.
Еще раз проверьте свои требования к времени восстановления. Не-FT VMware HA может загрузить виртуальную машину на другом хосте с простоями в пару минут.
Если вы серьезно относитесь к FT, подумайте о том, чтобы выделить 3 или 4 из этих 1-гигабитных каналов для FT или перейти на что-то вроде 25 Gb Ethernet.