Сценарий:
Заказчик недавно перенес кластерные серверы БД HANA на облачную платформу Azure, но это физические серверы в Azure (предложение: Azure HLI). Обычно эти HLI (серверы БД HANA) в Azure не могут быть доступны напрямую, даже из виртуальных сетей Azure. Другими словами, HLI не могут получить доступ к серверам, размещенным в другой виртуальной сети или в локальных центрах обработки данных клиента, и наоборот. Итак, клиент подготовил экспресс-маршрут между HLI и одной из Prod VNET. Таким образом, любые серверы или виртуальные машины могут получить доступ к этим HLI. Но в других виртуальных сетях (таких как DEV, TEST) или в местах расположения клиентов эти HLI недоступны. Итак, чтобы преодолеть указанную выше проблему, мы подготовили виртуальную машину SLES 12 в Prod VNET и сделали ее в качестве сервера IPTABLE для преобразований NAT, чтобы решить два типа проблем: а) когда серверам HLI требуется доступ к приложениям / базам данных (здесь, Hadoop Server).
б) Когда локальным серверам центра обработки данных требуется доступ к HLI. Итак, в этом случае мы назначили Natted IP-адреса для локальных серверов, а также HLI следующим образом. См. Прилагаемую схему
Исходная подсеть - 10.10.x.x
HADNA001 - 192.168.1.2
HADNA002 - 192.168.1.3
HADNA003 - 192.168.1.4
Исходная подсеть - 172.168.x.x
HANANA001 - 192.168.1.5
HANANA002 - 192.168.1.6
HANANA003 - 192.168.1.7
Проблема:
Случай 1: Когда группа поддержки клиентов SAP начала получать данные из контроллера искры Hadoop, они видят запросы на тайм-аут. По их словам, они видят это только при высоких нагрузках. При обычных нагрузках этого не происходит. Этапы получения данных:
1) Используя HANA Studio, установленную на ноутбуке пользователей.
2) Подключитесь к любому из серверов HLI (в данном случае HANANA001)
3) Настройте нагрузки и запускайте нагрузки из контроллера Hadoop (HADNA001) через HLI (HANANA001).
Причем таймаут запроса динамический, может случиться 1-10 раз за 4 часа нагрузок.
Случай 2: Замечено, что когда мы пытаемся скопировать данные с помощью rsync с несколькими параллельными сеансами с локальных серверов на HLI через iptable, через некоторое время сеансы останавливаются. Этого не происходит в случае rsync с 5 сеансами. Если сеансов больше 5, сеансы тормозятся. Данные, которые мы пытаемся скопировать, составляют 2 ТБ с файлами по 5 ГБ каждый. Это причина, по которой мы пытаемся использовать несколько параллельных сеансов. Предполагается, что за один раз будет скопировано больше файлов размером 5 ГБ.
Мы пробовали захватить tcpdump и проанализировали журналы, у нас есть только флаги [F] и [R], которые не дают много информации. А также есть другие сетевые устройства между локальной версией и HLI, которые не показаны на прилагаемой диаграмме, и мы не имеем ни малейшего представления о них.
Этой проблемы нет с другими серверами iptable в другой среде или VNET. До сих пор заказчик сообщал нам о нескольких ошибках, которые они могут увидеть в HANA Studio.
1) Ошибка SQL, время ожидания запроса 403
2) Невозможно создать виртуальную таблицу, время ожидания запроса истекло.