У меня есть кластер из 3 хостов VMware ESXi6.0, которые не лицензированы для распределенного коммутатора VMware. В настоящее время на этих хостах настроена статическая группа LAG между 2 портами на сервере и портом каждого на паре коммутаторов Cisco Nexus 9372PX, соединенных вместе с vPC. Серверы подключаются через 10GbE по оптоволокну.
Насколько я понимаю, vPC позволяет коммутаторам формировать агрегированные ссылки между несколькими устройствами без использования стека. Итак, если я настроил статическую LAG, это, похоже, работает нормально.
Меня беспокоит то, что без такого протокола, как LACP, в случае отказа одного из коммутаторов Cisco или отказа одной из сетевых адаптеров сервера невозможно повторно согласовать, какие порты могут участвовать в LAG, поэтому мы потеряем теоретическое 50% трафика (на основе Src / Dst IP Hash).
Есть ли лучший способ настроить эту агрегацию ссылок? Есть ли у 10GbE какие-либо преимущества в наличии агрегированного канала (на мой взгляд, нет), и должен ли я просто позволить VMware «делать свое дело» в отношении аварийного переключения? Какую конфигурацию я должен использовать на коммутаторе?
Я уже много раз занимался этим исследованием, и все пути, похоже, указывают на распределенный коммутатор VMware, который, к сожалению, для нас непомерно дорог.
Хороший вопрос.
Нет необходимости запускать статическую LAG в VMware. Если вы не можете использовать распределенные коммутаторы VMware (vD) и LACP, лучше всего просто использовать аварийное переключение VMware и установить порядок выбора сетевых адаптеров в диалоговых окнах Standard vSwitch и группы портов.
Я не знаю, какова ваша ситуация с хранилищем, но для большинства групп портов установка всех адаптеров в активное состояние - это нормально.
Вы также можете переопределить порядок и закрепить конкретный сетевой адаптер как активный, а другой как резервный для управления потоком трафика.
Пример группы сетевых портов виртуальной машины:
Пример группы портов vmotion: