Назад | Перейти на главную страницу

Кассандра добавляет новый центр обработки данных в работающий кластер

Я использую cassandra dse 4.7, 3-узловой кластер с одним центром обработки данных, теперь мы планируем добавить еще один центр обработки данных с 3 узлами. Я выполнил шаги, указанные в:
http://docs.datastax.com/en/cassandra/2.0/cassandra/operations/ops_add_dc_to_cluster_t.html.
У нас есть около 20 ГБ данных на каждом узле (всего 60 ГБ).

Проблема в том, когда я бегаю:

nodetool rebuild --old_datacenter_name on one of new node

синхронизировать данные из кластера очень медленно. Я уже увеличил getstreamthroughput и getcompactionthroughput но все равно не повезло.

Есть ли другие параметры, которые я мог бы настроить для более быстрой синхронизации данных с вновь добавленным узлом?

Я нашел причину, по которой он работает медленно, и разбил мой узел во время восстановления,
в моем случае проблема заключается во вторичном индексе, я создал вторичный индекс для каждой таблицы, и во время перестройки он занимает больше времени и съедает всю память кучи, из-за этого мой узел много раз падал.

Я просто удалил вторичный индекс и попробовал, он работает нормально. после перестройки я снова создал вторичный индекс.