Назад | Перейти на главную страницу

Время ожидания запроса / остановка сеансов через IPTABLE (DNAT)

Сценарий:

Заказчик недавно перенес кластерные серверы БД HANA на облачную платформу Azure, но это физические серверы в Azure (предложение: Azure HLI). Обычно эти HLI (серверы БД HANA) в Azure не могут быть доступны напрямую, даже из виртуальных сетей Azure. Другими словами, HLI не могут получить доступ к серверам, размещенным в другой виртуальной сети или в локальных центрах обработки данных клиента, и наоборот. Итак, клиент подготовил экспресс-маршрут между HLI и одной из Prod VNET. Таким образом, любые серверы или виртуальные машины могут получить доступ к этим HLI. Но в других виртуальных сетях (таких как DEV, TEST) или в местах расположения клиентов эти HLI недоступны. Итак, чтобы преодолеть указанную выше проблему, мы подготовили виртуальную машину SLES 12 в Prod VNET и сделали ее в качестве сервера IPTABLE для преобразований NAT, чтобы решить два типа проблем: а) когда серверам HLI требуется доступ к приложениям / базам данных (здесь, Hadoop Server).

б) Когда локальным серверам центра обработки данных требуется доступ к HLI. Итак, в этом случае мы назначили Natted IP-адреса для локальных серверов, а также HLI следующим образом. См. Прилагаемую схему

Исходная подсеть - 10.10.x.x

HADNA001 - 192.168.1.2

HADNA002 - 192.168.1.3

HADNA003 - 192.168.1.4

Исходная подсеть - 172.168.x.x

HANANA001 - 192.168.1.5

HANANA002 - 192.168.1.6

HANANA003 - 192.168.1.7

Проблема:

Случай 1: Когда группа поддержки клиентов SAP начала получать данные из контроллера искры Hadoop, они видят запросы на тайм-аут. По их словам, они видят это только при высоких нагрузках. При обычных нагрузках этого не происходит. Этапы получения данных:

1) Используя HANA Studio, установленную на ноутбуке пользователей.

2) Подключитесь к любому из серверов HLI (в данном случае HANANA001)

3) Настройте нагрузки и запускайте нагрузки из контроллера Hadoop (HADNA001) через HLI (HANANA001).

Причем таймаут запроса динамический, может случиться 1-10 раз за 4 часа нагрузок.

Случай 2: Замечено, что когда мы пытаемся скопировать данные с помощью rsync с несколькими параллельными сеансами с локальных серверов на HLI через iptable, через некоторое время сеансы останавливаются. Этого не происходит в случае rsync с 5 сеансами. Если сеансов больше 5, сеансы тормозятся. Данные, которые мы пытаемся скопировать, составляют 2 ТБ с файлами по 5 ГБ каждый. Это причина, по которой мы пытаемся использовать несколько параллельных сеансов. Предполагается, что за один раз будет скопировано больше файлов размером 5 ГБ.

Мы пробовали захватить tcpdump и проанализировали журналы, у нас есть только флаги [F] и [R], которые не дают много информации. А также есть другие сетевые устройства между локальной версией и HLI, которые не показаны на прилагаемой диаграмме, и мы не имеем ни малейшего представления о них.

Этой проблемы нет с другими серверами iptable в другой среде или VNET. До сих пор заказчик сообщал нам о нескольких ошибках, которые они могут увидеть в HANA Studio.

1) Ошибка SQL, время ожидания запроса 403

2) Невозможно создать виртуальную таблицу, время ожидания запроса истекло.

введите описание изображения здесь

введите описание изображения здесь