Мы используем Fortibalancer для наших веб-серверов (Win2012 с IIS), и мы столкнулись со странной проблемой. Пользователи IE будут испытывать таймауты (~ 77 с) при получении ответа от наших серверов. Трассировки пакетов показывают, что запросы ZeroWindow и ACK происходят во время тайм-аутов.
Вот факты:
Когда мы обходим балансировщики нагрузки, нет проблем и нет пакетов Zero Window (не говоря уже о проверках)
Трассировки пакетов на серверах показывают пакеты Zero Window к балансировщики нагрузки, но не к серверам
Wireshark показывает максимальный размер пакета как 16 КБ при использовании балансировщиков нагрузки, но показывает 64 КБ, когда клиенты подключаются напрямую к серверам.
Проблема не связана с загрузкой: это может произойти при почти полном отсутствии трафика или в периоды высокого трафика.
Мы не можем воспроизвести проблему, но это происходит примерно в предсказуемое время (~ 9:30 или ~ 3:30), но не каждый день. (В это время в нашей среде не происходит ничего особенного).
Пользователи Firefox НИКОГДА не сталкиваются с этой проблемой.
Версия IE, похоже, не имеет значения: у пользователей IE 8-11 такая же проблема.
LB обновлены. Они выполняют разгрузку SSL, а также балансировку ссылок и нагрузки. Использование ЦП на LB никогда не превышало 10%.
Из-за №1 мы знаем, что проблема не в самих серверах.
Из-за № 2 кажется, что LB - узкое место.
Номер 3 заставляет меня задуматься, и, похоже, нет возможности увеличить размер окна (мы пробовали, и мы не можем увеличить размер окна с 16 КБ).
Номер 5 - настоящий убийца. Наше приложение недостаточно хорошо работает в других браузерах для тестирования, но FF - это единственный браузер, который не является IE, и у пользователей никогда не было задержек. FF настолько надежен, что мы начинаем переводить клиентов на FF и до сих пор не использовали ZeroWindows, а пользователи IE продолжают их использовать. По их трассировке пакетов я вижу, что размер пакета для LB на 100-200 байт больше, чем для потоков пакетов IE.
Вопрос:
Что я могу проверить дальше, чтобы найти направление для решения проблемы? Есть идеи о том, в чем может быть проблема?