Назад | Перейти на главную страницу

Rsyncable Snappy?

У меня есть несколько массивных кластеров Cassandra, которые я поддерживаю на EC2. Внешнее резервное копирование занимает много времени, так как моментальные снимки должны быть подвергнуты таргетингу и сжатию, а затем переданы по сети из экземпляра EC2 в EBS.

У меня вопрос, можем ли мы сократить время резервного копирования с помощью cp и rsync. Допустим, у EBS есть предыдущая резервная копия. Можем ли мы скопировать эту резервную копию в EBS, избегая сети, а затем просто синхронизировать различия с текущими снимками для создания новой резервной копии?

Мысли? Одна проблема может заключаться в том, что все наши семейства столбцов сжаты мгновенно. Является ли snappy rsyncable? И приведет ли сохранение всех этих SSTables и gzip-архивов с помощью --rsyncable к архиву, который в конечном итоге является дружественным к rsync?

Да, вы можете использовать rsync. Фактически, мы успешно используем эту стратегию резервного копирования с нашим кластером из 10 узлов.

Позвольте мне сначала заявить, что я не рекомендую запускать Cassandra на EBS. Это кошмар. Однако резервные копии на EBS - это нормально.

К каждому экземпляру прикреплен том EBS. Когда мы хотим запустить резервное копирование, мы делаем простой снимок и синхронизируем его с томом EBS. Не беспокойтесь об использовании tar или попытках сжать файлы, они уже сжаты. После завершения rsync сделайте снимок диска EBS. Это очень быстро и позволяет копировать резервные копии в другое место на досуге.