РЕШЕНО
Azure с ExpressRoute.
У нас есть группа машин для обслуживания, которые отключаются ночью, чтобы сократить ресурсы. Все работает нормально месяцами. Вчера мы пришли и обнаружили, что несколько машин недоступны. К ним можно получить доступ из своей подсети Azure, но не из других частей сети.
После устранения неполадок мы заметили, что они потеряли все маршруты BGP, которые обычно отображаются в их сетевом интерфейсе. У них есть UDR только для своей локальной подсети.
У нас есть открытое дело, но в настоящее время в игре с указанием пальца оно начинает раскрываться.
Все рабочие машины имеют свои маршруты от BGP. Это стало еще более срочным, потому что производственная машина перезагрузилась вчера вечером, и теперь это то же самое.
Сетевой адаптер показывает, что он подключен к виртуальной сети, а другие сетевые адаптеры, подключенные к этой виртуальной сети, работают, а эффективные маршруты показывают свои маршруты из BGP.
Мы попытались повторно развернуть виртуальную машину, полагая, что это, возможно, проблема с хостом Azure, но безрезультатно.
Проблема решена.
В конце концов Microsoft обнаружила и признала, что не переданные накануне вечером обновления вызвали проблему NAT на 5 кластерах, которые препятствовали распространению маршрутов BGP на определенные хосты.
Повторное развертывание, новые сетевые адаптеры и т. Д. Не работали, так как мы перемещались на другие хосты или меняли сетевые адаптеры, но в тех же затронутых кластерах.