Я экспериментирую с дедупликацией в хранилище Server 2012 R2. Вчера вечером я позволил ему выполнить первую оптимизацию дедупликации, и я был рад увидеть, что он потребовал уменьшения на 340 ГБ.
Однако я знал, что это слишком хорошо, чтобы быть правдой. На этом диске 100% дедупликации были получены из резервных копий SQL Server:
Это кажется нереалистичным, учитывая, что в папке есть резервные копии баз данных, размер которых в 20 раз больше. Например:
Он считает, что файл резервной копии размером 13,3 ГБ был уменьшен до 0 байт. И, конечно же, этот файл на самом деле не работает, когда я его тестировал.
Чтобы усугубить травму, на этом диске есть еще одна папка с почти ТБ данных, которые должен много вычитали, но не сделали.
Работает ли дедупликация в Server 2012 R2?
Дедупликация работает.
При дедупликации поле Размер на диске становится бессмысленным. Файлы больше не являются обычными «файлами», а являются точками повторной обработки и не содержат фактических данных, а содержат метаданные для механизма дедупликации для восстановления файла. Насколько я понимаю, вы не можете получить экономию для каждого файла, поскольку хранилище фрагментов дедупликации предназначено для каждого тома, поэтому вы получаете экономию только для каждого тома. http://msdn.microsoft.com/en-us/library/hh769303(v=vs.85).aspx
Возможно, ваша задача дедупликации еще не завершена, если еще не были списаны некоторые другие данные. Это не очень быстро, по умолчанию ограничено по времени и может быть ограниченным в ресурсах в зависимости от вашего оборудования. Проверьте расписание дедупликации в диспетчере сервера.
Я развернул дедупликацию в нескольких системах (Windows 2012 R2) в разных сценариях (SCCM DP, различные системы развертывания, общие файловые серверы, файловые серверы домашних папок и т. Д.) Уже около года. Просто убедитесь, что вы полностью пропатчены, я помню несколько исправлений для дедупликации (как накопительных обновлений, так и исправлений) после RTM.
Однако есть некоторые проблемы, связанные с тем, что некоторые системы не могут читать данные напрямую из оптимизированных файлов в локальной системе (IIS, SCCM в некоторых сценариях). Как предлагает yagmoth555, вы должны либо попробовать Expand-DedupFile, чтобы не оптимизировать его, либо просто сделать копию файла (целевой файл не будет оптимизирован до следующего запуска оптимизации) и повторить попытку. http://blogs.technet.com/b/configmgrteam/archive/2014/02/18/configuration-manager-distribution-points-and-windows-server-2012-data-deduplication.aspx https://kickthatcomputer.wordpress.com/2013/12/22/no-input-file-specified-windows-server-2012-dedupe-on-iis-with-php/
Если ваша резервная копия SQL действительно повреждена, я считаю, что это связано с другой проблемой, а не с технологией дедупликации.
Похоже, я, возможно, бросил вызов, сказав, что такого рода дедупликация невозможна. По-видимому, это вполне возможно, потому что в дополнение к этим несжатым резервным копиям SQL Server у меня также есть резервные копии уровня моментальных снимков VMWare для хост-виртуальных машин.
Как предложил yagmoth555, я запустил Expand-DedupeFile
на некоторых из этих 0-байтовых файлов, и в конце я получил полностью пригодный для использования файл.
Затем я посмотрел на свою методику тестирования, чтобы понять, как я определил, что файлы не годятся, и обнаружил недостаток в своих тестах (разрешения!).
Я также открыл 0-байтовый файл резервной копии с дедупликацией в шестнадцатеричном редакторе, и все смотрел ХОРОШО.
Я скорректировал свою методологию тестирования, и, похоже, все действительно работает. Когда я его оставил, дедупликация стала лучше, и теперь я сэкономил более 1,5 ТБ пространства благодаря дедупликации.
Я собираюсь протестировать это более тщательно, прежде чем запустить его в производство, но сейчас это выглядит многообещающим.
Да, но я видел только случай дедупликации базы данных гипервкластера. От 4 ТБ до 400 ГБ, и виртуальная машина работала. ОС была полностью пропатчена.
Для вашего файла резервной копии sql, это дамп, который вы можете прочитать в нем? Я бы проверил содержание. По этой части я не могу ответить, как он выводит файл ascii.