Я прочитал документация для DDPEval.exe и различные блоги и так далее, и не могу найти никакой информации о том, как интерпретировать результаты.
Я запустил инструмент на диске на одном из наших серверов и обнаружил, что результаты сбивают с толку, особенно в отношении «Оптимизированных файлов» и «сжатия». Чтобы попытаться получить больше понимания, я снова запустил инструмент только для определенной папки, где нет сжатия NTFS (содержимое - это резервные копии SQL Server). Для краткости опубликую только результаты этого второго теста:
Evaluated folder size: 69.07 GB
Files in evaluated folder: 6
Processed files: 6
Processed files size: 69.07 GB
Optimized files size: 15.61 GB
Space savings: 53.45 GB
Space savings percent: 77
Optimized files size (no compression): 69.04 GB
Space savings (no compression): 26.93 MB
Space savings percent (no compression): 0
Что означают эти числа и говорит ли мне инструмент, что я могу сэкономить 53,45 ГБ или 26,93 МБ?
Вы можете сэкономить 53,45 ГБ сокращение использования пространства за счет 77% в случае, если вы используете как дедупликацию, так и сжатие.
Вы можете сэкономить 26,93 МБ если используется только дедупликация.
Обычно выигрыш от дедупликации рассчитывается с использованием коэффициента дедупликации. Я бы порекомендовал вам использовать альтернативный бесплатный инструмент под названием Deduplication Analyzer: https://www.starwindsoftware.com/starwind-deduplication-analyzer.
Это дает вам более прозрачный и понятный результат, обеспечивая отраслевой стандарт Коэффициент дедупликации параметр.
Сжатие и оптимизация / дедупликация - это не одно и то же. Сжатие принимает данный файл и сохраняет данные по-разному, так что одинаковые части сохраняются один раз с указателями и некоторым пересчетом того, как организовать файл, а не несколько раз.
Дедупликация / оптимизация - это сравнение нескольких файлов друг с другом. Если у вас есть 10 копий определенного файла или блока в файле, вместо этого вы можете иметь одну копию с 10 указателями на эту копию. Это не изменяет структуру самого файла, а просто сообщает ОС: «Эй, если вам нужен файл xyz.txt из местоположения Z, вместо этого найдите его в местоположении A.»
Я не работал с этим инструментом, поэтому я немного догадываюсь, но, похоже, он говорит, что если вы оставите сжатие выключенным и дадите ему дедупликацию для этого файла во всех его экземплярах, вы уменьшите объем до 29,63 МБ .
Но если вы включите сжатие, это может еще больше ухудшить ситуацию - я предполагаю, потому что он может дедупликации блоков в сжатых файлах.
Однако имейте в виду: сжатие действительно приводит к накладным расходам на доступ к файлу, поскольку требует вычислений со стороны ОС для восстановления того, как должно выглядеть содержимое файла. Это больше усилий, чем дедупликация, которая также требует реконструкции, но требует «иди и найди эту часть», тогда как сжатие требует «вычислить эту часть», когда она что-то получает.