У нас настроен и работает EC2 Windows Server в нашем VPC, подключенный к нашей сети через Juniper 5GT. Это работает хорошо, с туннелем вверх и стабильно.
Если затем я присоединяюсь к серверу в нашем локальном домене, он, похоже, работает - я могу затем войти в систему, используя учетные данные домена, и использовать учетные записи домена при применении безопасности к папкам и т. Д.
Если я выйду из системы через час, ящик перестанет отвечать. Я не могу пинговать его, хотя трассировка проходит до конца, за исключением последнего перехода, так что туннель в порядке. Я не могу использовать RDP. Если я его перезагружаю, он некоторое время работает, прежде чем делать то же самое.
Отмена присоединения к домену решает проблему, и он остается стабильным. Журналы событий не показывают ничего очевидного, по крайней мере, для меня.
Любые идеи?
Я нашел ответ на этот вопрос, или, по крайней мере, на 90% уверен, что нашел. На рассматриваемом сервере была установлена TFS 2010 до того, как он был присоединен к домену, и он не был переустановлен / обновлен (пока) с тех пор, как машина была присоединена к домену.
Я начал замечать ошибки журнала событий, связанные с службами TFS, пытающимися найти наш домен, в частности TF200035 события (это деталь; журнал событий показывает это как 3071). Они относятся к почасовой репликации TFS AD. Поскольку наш экземпляр умирал примерно через час, это казалось хорошим местом для начала поиска.
Я отключил следующие две службы:
... и с тех пор экземпляр остается прочным. Я понятия не имею, почему это может привести к тому, что экземпляр перестанет отвечать на запросы, но следующим шагом, вероятно, будет переустановка TFS вместе с некоторым скрещиванием пальцев.