Мы выполняли инкрементное резервное копирование с помощью Duply на нашем основном сервере в корзину S3. Однако мы обнаружили, что во время резервного копирования наблюдается высокая нагрузка на сервер (это сервер Amazon EC2).
Мы думаем, что это может быть связано с тем, что он проверяет каждый файл на S3 на предмет изменений.
Каким образом можно снизить нагрузку на сервер?
Поскольку мы делаем резервное копирование каждые четыре часа, возможно, мы могли бы выполнить резервное копирование только для файлов / папок старше 4 часов.
Если вам нужна полная резервная копия системы, вы можете переключиться на снимки ...
Если вам нужны отдельные файлы, смотрели ли вы инструменты AWS CLI? Если это экземпляр Amazon Linux, они уже установлены. Если нет, см. инструкции по установке здесь.
Вы можете установить запланированное задание, используя команду примерно такого рода:
aws s3 sync /your/path/to/backup s3://yourbucket/path --recursive
в операции синхронизации исходный файл будет загружен только в том случае, если размер файла отличается от размера объекта s3, время последнего изменения локального файла новее, чем время последнего изменения объекта s3, или если локальный файл не существует.
Для дополнительной возможности восстановления включите управление версиями в корзине S3, и вы сможете восстанавливать более старые версии файлов, если что-то было случайно изменено .... тогда вы можете использовать политики жизненного цикла S3, чтобы минимизировать количество версий / возраст версий, которые вы поддерживать.