Назад | Перейти на главную страницу

Разрешение IP-адреса в настройке Cassandra MultiDC

У нас есть сценарий, для которого мы рассматриваем использование apache Cassandra для развертывания для наших нужд хранения данных. Настройка должна быть распределена между несколькими центрами обработки данных в разных регионах (физических местоположениях). С каждым центром обработки данных, имеющим несколько узлов. Однако мы можем позволить себе не более 1 общедоступного IP-адреса для каждого центра обработки данных. Узлы внутри центра обработки данных обмениваются данными по частному IP. Мы планируем использовать RF = 3 и OldNetworkTopologyStrategy для размещения реплик.

1. Это заставляет нас задаться вопросом: как будет происходить обнаружение узлов и как будет формироваться кольцо Cassandra между несколькими центрами обработки данных?

  1. Как в этом сценарии будет осуществляться разделение данных?

  2. Если, скажем, данные находятся в центре обработки данных 1, узле 2, а запрос чтения отправляется в центр обработки данных 2, узел 1, предполагая, что DC2 не имеет локальной реплики, то как будет обслуживаться запрос чтения? Это наша самая большая проблема, поскольку статьи, касающиеся публичных / частных IP-адресов для cassandra, найти не удалось.

Как и в Cassandra любой узел может быть запрошен для данных, и то же самое касается запросов на запись, cassandra - наш первый выбор в средах, которые мы должны развернуть.

Вам нужно будет настроить VPN; Кассандра предполагает, что каждый узел может напрямую связываться друг с другом (даже если он действительно выполняет эффективную запись с несколькими DC, т.е. отправляет только одну копию на каждый DC, где координатор пересылает ее другим, если это необходимо).