Мы пытаемся проверить состояние репликации в нашем кластере cassandra. Мой коллега обнаружил, что на нескольких узлах существует лишь небольшое количество стабильных файлов. Все остальные уникальны.
Для меня это имеет смысл. Насколько я понимаю, каждый узел должен отвечать за уникальный набор диапазонов и должен иметь sstables, отражающие эти диапазоны. Но сейчас я не уверен.
Должны ли мы найти хотя бы n копий каждой стабильной машины с коэффициентом репликации n? Или копии sstables являются результатом начальной загрузки и еще не сжаты?
Файлы SSTable создаются, когда происходит сброс memtable и когда SSTables уплотняются. На каждом узле это может происходить в разное время (плюс другие факторы, например, короткие простои и т. Д.).
Для правильной репликации всех данных вам необходимо реализовать процесс восстановления - либо путем явного вызова nodetool repair
или с помощью некоторых инструментов, таких как DataStax OpsCenter (только для DSE) или Reaper (или что-то в этом роде).