Я выступаю за внедрение надежной концепции резервного копирования, прежде чем столкнуться с потерей данных. Резервное копирование на месте и за его пределами - один из столпов такой концепции. Однако я узнал, что метаданные иногда столь же ценны, как и фактическое содержимое файла.
Например. У меня была резервная копия данных и восстановленная файловая система btrfs, и мне нужно было решить, восстанавливать ли резервную копию или сохранять восстановленные данные. Так как у меня не было контрольных сумм файлов, я решил восстановить их из резервной копии.
После восстановления я узнал, что дата создания файла, право собственности и разрешения также имеют решающее значение, чтобы отслеживать. К счастью, мои данные структурированы, и я могу установить значения по умолчанию для каждого сценария.
Однако, чтобы улучшить свой план резервного копирования, я хочу хранить метаданные своих файлов.
Первым действием было sha256sum
и stat
данные и сохраните их на диск.
Как можно проще и эффективнее индексировать и хранить метаданные файлов в Linux?
Я просмотрел git-application, который выглядит многообещающим, и я видел, как люди используют updatedb для отслеживания файлов (также метаданных?), Но, может быть, у кого-то есть варианты получше?
Вы можете использовать инструмент целостности системы, например tripwire
, AIDE
и т. д. для хранения контрольных сумм и метаданных ваших файлов. Эти инструменты предназначены для обнаружения изменений в метаданных и содержимом файлов, поэтому они создают индекс этой информации.
Большинство систем резервного копирования могут сохранять метаданные.
Архивы tar содержат метаданные разрешений и отметок времени, но желаемую контрольную сумму sha256.
Изображение всего блочного устройства содержит исходные метаданные файла. Однако это может иметь операционные проблемы. Например, может быть сложно выполнить частичное восстановление, и для перехода на другой тип файловой системы требуются дополнительные действия.
Или возьмем хорошо задокументированный пример Борга. Метаданные файла сохранены включает отметки времени и разрешения UNIX. А репозиторий можно проверить чтобы проверить его согласованность.
Для любого из них вы можете дополнительно вычислить и сохранить свой любимый хеш.
Какое бы программное обеспечение для резервного копирования ни использовалось, определите цель точки восстановления, а затем протестируйте восстановление. Восстановленные объекты должны иметь не только правильные метаданные, но и достоверные данные.
Для критически важного сервера используйте решение, которое выполняет резервное копирование всей машины, а не только копию файла. Таким образом будут сохранены метаданные и вся соответствующая конфигурация.
Если это виртуальная машина, какое-то программное обеспечение просто копирует весь файл данных гипервизора.