У меня есть группа DAG, настроенная между 2 серверами Exchange на 2 разных сайтах, подключенными через выделенный гигабитный канал. По какой-то причине время от времени удаленный узел удаляется из активного членства в отказоустойчивом кластере (даже если он находится в сети), тогда два сервера Exchange вступают в борьбу за то, кто является основным (журналы событий сообщают, что «Общий доступ к файлам Свидетелю не удалось выполнить арбитраж для общего файлового ресурса ", общий файловый ресурс существует, и доверенная подсистема Exchange имеет права администратора в этом поле и в этом общем ресурсе, но окно настройки DAG сообщает, что его нет).
затем всем пользователям предлагается ввести пароль, и иногда все происходит на несколько минут. Даже общие папки иногда отключаются.
Он сообщает, что существует 3 разные подсети (подсеть доступа, подсеть iSCSI и немаршрутизируемая подсеть IPv6), и у меня отключена репликация для всех, кроме подсети доступа. Это та же подсеть, в которой DAG имеет свои IP-адреса (я дал ей 2). В двух других подсетях репликация отключена.
Кто-нибудь сталкивался с этой проблемой раньше?
Оказывается, это была известная проблема с Exchange 2010, подробнее здесь Блог команды разработчиков Exchange
Попробуйте увеличить пределы сердцебиения по умолчанию.
http://technet.microsoft.com/en-us/library/dd197562%28WS.10%29.aspx
Я бы предложил 25 секунд для локальных серверов и 50 секунд для WAN-соединений. Это должно помочь. Если вы используете массивы хранения и VMware и выполняете сканирование хранилища, это вызовет отказоустойчивость. Если вы используете jumbo-кадры на iSCSI, которые видит ваша сеть MAPI, это может их вызвать. Есть много причин. Я бы начал там.