Кажется, что вы всегда зависите от доступности какого-либо хостинг-провайдера. Даже если ваши серверы геоизбыточны в центрах обработки данных, у вас все равно есть DNS-запись, указывающая на какой-то IP-адрес, и она будет разрешена каким-то DNS-сервером, который может исчезнуть в любую секунду. Есть ли решение для этого? Я видел, как люди предлагали балансировку нагрузки DNS с каким-то механизмом для определения времени простоя и переключения при отказе. Какой провайдер DNS предлагает это? И все еще полагается на то, что один из его центров обработки данных не выходит из строя?
Если предположить, что все, что находится за нашей первой линией контакта (прокси-сервер LB), уже является георезервным - действительно ли есть реальный способ позаботиться об этом последнем шаге?
На самом деле, может быть несколько DNS-серверов, обслуживающих определенный домен, посмотрите на домен stackoverflow.com:
$ nslookup -type=ns stackoverflow.com Server: 192.168.0.1 Address: 192.168.0.1#53 Non-authoritative answer: stackoverflow.com nameserver = ns3.serverfault.com. stackoverflow.com nameserver = ns1.serverfault.com. stackoverflow.com nameserver = ns2.serverfault.com. Authoritative answers can be found from: $
Доменные имена в stackoverflow.com могут быть разрешены тремя серверами имен, поэтому даже если один или два из них вышли из строя, доменные имена все равно могут быть разрешены.
RFC, содержащие рекомендации для DNS-серверов, предлагают использовать как минимум три сервера имен, размещенных в логически и географически разных местах, чтобы избежать именно этой проблемы. IP-адреса, опубликованные для этих серверов, также могут быть настроены с использованием IP-адресации, поэтому серверы в разных местах могут использовать один и тот же IP-адрес. Маршрутизация вокруг сбоев в значительной степени автоматическая, если используется правильная маршрутизация (т.е. одно место, привязанное к этому IP-адресу, отключается, и трафик просто автоматически направляется в другое). Корневые DNS-серверы и многие из основных TLD настроены таким образом, чтобы противостоять сбоям и быть устойчивыми к DDoS-атакам. Вот почему такие службы, как OpenDNS, имеют почти 100% время безотказной работы даже при обслуживании миллиардов запросов.
Компании потратили миллионы долларов на избыточную инфраструктуру, чтобы сократить время простоя, но сбои все еще могут происходить, часто неожиданными способами, связанными с человеческим фактором, а не с технологическими факторами.