Я использую cassandra dse 4.7, 3-узловой кластер с одним центром обработки данных, теперь мы планируем добавить еще один центр обработки данных с 3 узлами. Я выполнил шаги, указанные в:
http://docs.datastax.com/en/cassandra/2.0/cassandra/operations/ops_add_dc_to_cluster_t.html.
У нас есть около 20 ГБ данных на каждом узле (всего 60 ГБ).
Проблема в том, когда я бегаю:
nodetool rebuild --old_datacenter_name on one of new node
синхронизировать данные из кластера очень медленно. Я уже увеличил getstreamthroughput
и getcompactionthroughput
но все равно не повезло.
Есть ли другие параметры, которые я мог бы настроить для более быстрой синхронизации данных с вновь добавленным узлом?
Я нашел причину, по которой он работает медленно, и разбил мой узел во время восстановления,
в моем случае проблема заключается во вторичном индексе, я создал вторичный индекс для каждой таблицы, и во время перестройки он занимает больше времени и съедает всю память кучи, из-за этого мой узел много раз падал.
Я просто удалил вторичный индекс и попробовал, он работает нормально. после перестройки я снова создал вторичный индекс.