В настоящее время в нашем кластере Cassandra работает 12 узлов. В конечном итоге, даже если пара узлов выйдет из строя, мы все равно будем работать. Во мне паранойя хочется делать хотя бы одну резервную копию в день и хранить ее на Amazon S3. У меня следующий вопрос:
Достаточно ли при резервном копировании Cassandra запустить резервное копирование с одного узла, или мне нужно запускать сценарий резервного копирования с каждого из 12 узлов и отправлять соответствующую резервную копию на S3? Если в какой-то момент требуется восстановление, нужно ли делать резервную копию из резервной копии отдельных узлов, или есть способ «агрегировать» резервные копии (при условии, что вам нужно взять их с каждого узла по отдельности) в один большой процесс восстановления?
Немного смущает документация. Просто хочу, чтобы в моем кластере Cassandra работал эффективный процесс резервного копирования.
Вам необходимо создать резервную копию каждого узла, если каждый узел не хранит 100% данных, тогда вы можете создать резервную копию только одного узла.
Самый простой способ создать резервную копию Cassandra - создать резервную копию каждого узла. Я использовал tablenap раньше, чтобы делать это автоматически, и это довольно хорошо. Еще есть Priam от Netflix, но я лично не пробовал. https://github.com/Netflix/Priam