У нас всегда были проблемы с DFS, но в последнее время ситуация ухудшилась без видимой причины и стала вредной. У нас есть один главный сервер и соединения DFS с четырьмя другими серверами. Четыре сервера не изменяют никаких файлов, поэтому все репликации всегда передаются с главного сервера на четыре других сервера. В реплицированном каталоге около 900 000 файлов. В последние недели каждый раз, когда мы проверяем, в резервных журналах DFS есть сотни тысяч файлов. Например, в настоящий момент главный сервер реплицирует около 700 000 файлов на три из четырех серверов, а четвертый в порядке. Иногда выключен только один, иногда два, а на этот раз три. Кроме того, это никогда не бывает одинакового набора серверов. Немыслимо, чтобы что-то периодически перебирало все 900 000 файлов. Самое большое изменение - это плановое обновление нескольких тысяч файлов каждые шесть часов.
Есть ли у кого-нибудь такая же проблема? Это известная проблема?
Обновить: (Это также ответ на некоторые вопросы, заданные Джеффом Майлзом). Проблема снова возникла несколько часов назад. Я установил несколько зондов утром и в течение дня наблюдал за серверами, и в, казалось бы, случайное время, три невыполненных задания увеличились до 3 миллионов изменений (что больше, чем общее количество файлов) в течение минуты. Ничего интересного в журнале событий DFS. Даже не "запустилась начальная репликация". Всего пара ошибок типа «соединение DFS потеряно или не отвечает», но они произошли примерно через 10 минут после факта. Скорее всего потому, что что-то подавилось огромными заделами. Что еще более важно, четвертый сервер в порядке. Это указывает на то, что 3 миллиона изменений, скорее всего, являются фиктивными. Кроме того, я не могу представить, чтобы что-то изменило такое количество файлов за такой короткий промежуток времени. Что касается технической настройки; это комбинация Win2003R2 и Win2008R2. Может быть проблема?
Поскольку вы видите чрезмерное количество файлов, реплицируемых в течение очень короткого периода времени, должно быть приложение, которое изменяет атрибуты файлов или значения USN Journal без изменения данных файла, например. Программное обеспечение резервного копирования, изменяющее бит архива, вызовет это, а также некоторые программы AV.
Тестирование совместимости антивирусных приложений с репликацией DFS
Я бы создал группу тестовой репликации для устранения и тестирования таких элементов, как программное обеспечение резервного копирования, программное обеспечение AV и т. Д., На репликацию. Я также хотел бы в дополнение к другим рекомендациям, которые вы получили, регистрировать и следить за изменениями в USN Journal без изменения данных файлов. Приведенная ссылка представляет собой хорошую статью о проверке приложений, изменяющих журнал USN, без изменения данных файла и, следовательно, вызывающих чрезмерную репликацию.
Также обратите внимание на экраны файлов, квоты и т. Д. Я видел несколько сценариев, когда файловый экран вообще останавливал репликацию.
Установлено ли у вас антивирусное программное обеспечение для сканирования частных папок DFSR (промежуточные, конфликтные и удаленные и т. Д.)?
-Кен
Если вы видите сотни тысяч файлов в очереди на регулярной основе, я бы предположил, что что-то меняет списки управления доступом к вашим файлам, особенно если вы не видите большого сетевого трафика, пока незавершенная работа очищается.
Один из способов проверить, что изменяет эти файлы, - включить аудит. Нед Пайл из группы служб каталогов Microsoft недавно выпустил блог, в котором используется аудит доступа к глобальным объектам, который может помочь вам определить, что меняется: http://blogs.technet.com/b/askds/archive/2011/03/10/global-object-access-auditing-is-magic.aspx
Я бы также проверил ваш журнал событий DFSR и поищу любой идентификатор события 4102 (начата начальная репликация) или 4104 (начальная репликация завершена). Если ваши файлы не изменяются, единственная причина, по которой я могу думать о сотнях тысяч файлов в очереди, - это первоначальная репликация. Если ваша служба DFSR дает сбой, это может привести к повреждению базы данных DFSR и вызвать начальную репликацию.
Если можете, я бы попытался использовать DFSR только для чтения, описанный здесь: http://blogs.technet.com/b/askds/archive/2010/03/08/read-only-replication-in-r2.aspx
Я полагаю, основываясь на вашем теге Server 2003, что вы еще не можете этого сделать, но его стоит упомянуть в зависимости от вашего варианта использования.
http://blogs.technet.com/b/askds/archive/2010/03/08/read-only-replication-in-r2.aspx
Сначала проверьте свою топологию. Внимательно просмотрите подключения репликации на вкладке «Подключения» в свойствах набора репликации:
Я видел, как случайно добавленные топологии с полной сеткой приводили к таким проблемам, как вы видите.
Другие возможные причины: - Антивирусное сканирование или индексация файлов на одном или нескольких серверах или на одном из их клиентов. (Открытие файла обновляет его время доступа, которое затем должно быть реплицировано для всех одноранговых узлов.) - Один или несколько очень больших файлов мешают репликации - Это должно отображаться в ваших журналах DFS-R.
Наконец, нужен ли вам DFS-R, или можно использовать обычный robocopy для синхронизации папок?