Назад | Перейти на главную страницу

Так много повторных передач через vDS с поддержкой NSX в vSphere

В настоящее время я тестирую сетевую среду VMware NSX и столкнулся с некоторыми проблемами.

Моя среда:

  • Кластер управления с 3 хостами и компонентами NSX на 2 выделенных хостах
  • Вычислительный кластер с 2 хостами
  • Один коммутатор 1 Гбит / с
  • vSphere версии 6.0 и NSX версии 6.2
  • Одна выделенная линия UTP на все хосты для управления и iSCSI (с тегами VLAN)
  • Одна выделенная линия UTP на все хосты для транзитной сети (для трафика виртуальных машин)
  • Одна выделенная линия UTP на хост управления для внешней сети

Когда VM V на Host H отправить данные в VM W на Host I в сети NSX происходит сильная задержка передачи. Я проверил множество случаев ниже:

Случаи с проблемой:

  1. V отправить около 20 МБ на W за один сеанс: ретрансляция около 19 МБ
  2. V отправьте около 50 МБ на W за один сеанс: ретрансляция только в 19 МБ
  3. V отправьте около 2 МБ на W в 30 одновременных сессиях: ретрансляция в случайном месте.

В этом случае я обнаружил несоответствие порядка пакетов (возможно, причина повторной передачи) в дампе пакетов из Hс vmnic(восходящий канал), а задержанные пакеты являются уникальными (ранее не появлялись в дампе), а в дампе из vDS нисходящий канал к ВМ V или sfw из V, они повторяются дважды (исходные пакеты и повторно переданные пакеты). Итак, я думаю, проблема в некоторых потерянных пакетах на стороне отправителя, особенно между виртуальными машинами. V и хост HФизическая сетевая карта.

Чтобы разделить путь / стек данных на два сектора и независимую проверку, я протестировал те же случаи с другой целевой виртуальной машиной. X на том же хосте H. Затем я получил чистый дамп и обнаружил, что проблем с повторной передачей между виртуальными машинами на одном и том же хосте нет. (поэтому я думаю, что на самом vDS и выше нет точки ошибки.)

Затем я проверил приведенные ниже случаи, чтобы убедиться, что проблема связана с интенсивным трафиком данных или тяжелой фильтрацией и / или инкапсуляцией или нет:

  1. тот же тест с Network I/O Control включен: та же проблема
  2. тот же тест без Network I/O Control: та же проблема с некоторыми различиями.
  3. тот же тест, но замедление throuput с N I/O C Limit: та же проблема
  4. тот же тест с TSO отключен vnic из V(драйвер e1000): та же проблема
  5. тот же тест с vDS MTU 9000: та же проблема с другим вопросом

Некоторые разные вещи:

когда Network I/O Control включен, сначала RTT увеличивается непосредственно перед повторной передачей, а затем после завершения повторной передачи, RTT значения находятся в стабильном диапазоне.

Но когда Network I/O Control выключен, RTT после повторной передачи также включается снова, как и при запуске.

Одна странная вещь, хотя я установил MTU до 9000, размер пакетов UTP, в которые встроены пакеты VxLAN, меньше 1600. Таким образом, эффект MTU 9000 не влияет.

У меня проблемы. Могу я получить помощь? Спасибо.


РЕДАКТИРОВАТЬ ---

Если виртуальные машины работают нормально, NSX отключен, vDS, Все хорошо.


РЕДАКТИРОВАТЬ* Есть ли похожие проблемы с OpenvSwitch?