Назад | Перейти на главную страницу

ZFS, дедупликация и файлы PST

Мне интересно узнать, какой максимальный коэффициент дедупликации можно ожидать для набора файлов PST.

У меня ~ 40Гб pst-файлов от ~ 15 пользователей с высоким уровнем дублирования вложений. Я запускаю тесты, чтобы увидеть, могу ли я значительно сэкономить место, если сохраню данные в ZFS с дедупликацией.

Для этой цели я установил тестовую установку Nexenta, но мне было интересно, сделал ли кто-то здесь это уже и какой уровень дедупликации я могу ожидать (или, другими словами, насколько чувствительны файлы pst к выравниванию блоков и какие параметры влиять на соотношение?).

Первоначальный тест показал очень низкий коэффициент дедупликации, и я обнаружил объяснение эта дедупликация на уровне блоков не будет эффективной, а дедупликация на уровне байтов будет намного лучше (и что она должна выполняться приложением, которое знает о внутренней организации), поэтому я просто дважды проверяю здесь, есть ли у кого-то еще ввод.

В противном случае я, вероятно, буду конвертировать файлы PST в IMAP.

Да, файлы PST вряд ли дадут нужные вам коэффициенты дедупликации. Вложения внутри PST не будут выровнены по блокам и готовы к дедупликации. Если вы хотите максимизировать возможности дедупликации с помощью ZFS, вам понадобится формат хранения, в котором вложения представляют собой отдельные файлы.