Назад | Перейти на главную страницу

Как сделать резервную копию / индексировать метаданные файла

Я выступаю за внедрение надежной концепции резервного копирования, прежде чем столкнуться с потерей данных. Резервное копирование на месте и за его пределами - один из столпов такой концепции. Однако я узнал, что метаданные иногда столь же ценны, как и фактическое содержимое файла.

Например. У меня была резервная копия данных и восстановленная файловая система btrfs, и мне нужно было решить, восстанавливать ли резервную копию или сохранять восстановленные данные. Так как у меня не было контрольных сумм файлов, я решил восстановить их из резервной копии.

После восстановления я узнал, что дата создания файла, право собственности и разрешения также имеют решающее значение, чтобы отслеживать. К счастью, мои данные структурированы, и я могу установить значения по умолчанию для каждого сценария.

Однако, чтобы улучшить свой план резервного копирования, я хочу хранить метаданные своих файлов.

Первым действием было sha256sum и stat данные и сохраните их на диск.

Как можно проще и эффективнее индексировать и хранить метаданные файлов в Linux?

Я просмотрел git-application, который выглядит многообещающим, и я видел, как люди используют updatedb для отслеживания файлов (также метаданных?), Но, может быть, у кого-то есть варианты получше?

Вы можете использовать инструмент целостности системы, например tripwire, AIDEи т. д. для хранения контрольных сумм и метаданных ваших файлов. Эти инструменты предназначены для обнаружения изменений в метаданных и содержимом файлов, поэтому они создают индекс этой информации.

Большинство систем резервного копирования могут сохранять метаданные.

Архивы tar содержат метаданные разрешений и отметок времени, но желаемую контрольную сумму sha256.

Изображение всего блочного устройства содержит исходные метаданные файла. Однако это может иметь операционные проблемы. Например, может быть сложно выполнить частичное восстановление, и для перехода на другой тип файловой системы требуются дополнительные действия.

Или возьмем хорошо задокументированный пример Борга. Метаданные файла сохранены включает отметки времени и разрешения UNIX. А репозиторий можно проверить чтобы проверить его согласованность.

Для любого из них вы можете дополнительно вычислить и сохранить свой любимый хеш.


Какое бы программное обеспечение для резервного копирования ни использовалось, определите цель точки восстановления, а затем протестируйте восстановление. Восстановленные объекты должны иметь не только правильные метаданные, но и достоверные данные.

Для критически важного сервера используйте решение, которое выполняет резервное копирование всей машины, а не только копию файла. Таким образом будут сохранены метаданные и вся соответствующая конфигурация.

Если это виртуальная машина, какое-то программное обеспечение просто копирует весь файл данных гипервизора.