Назад | Перейти на главную страницу

Должен ли я видеть одинаковые sstables на нескольких узлах cassandra?

Мы пытаемся проверить состояние репликации в нашем кластере cassandra. Мой коллега обнаружил, что на нескольких узлах существует лишь небольшое количество стабильных файлов. Все остальные уникальны.

Для меня это имеет смысл. Насколько я понимаю, каждый узел должен отвечать за уникальный набор диапазонов и должен иметь sstables, отражающие эти диапазоны. Но сейчас я не уверен.

Должны ли мы найти хотя бы n копий каждой стабильной машины с коэффициентом репликации n? Или копии sstables являются результатом начальной загрузки и еще не сжаты?

Файлы SSTable создаются, когда происходит сброс memtable и когда SSTables уплотняются. На каждом узле это может происходить в разное время (плюс другие факторы, например, короткие простои и т. Д.).

Для правильной репликации всех данных вам необходимо реализовать процесс восстановления - либо путем явного вызова nodetool repairили с помощью некоторых инструментов, таких как DataStax OpsCenter (только для DSE) или Reaper (или что-то в этом роде).