Один из основных проектов, которые я запланировал на 2010 год, - это попытка смягчить некоторые из единой точки отказа (SPOF) в сети, которой я сейчас управляю. В настоящее время у нас есть единственная стойка центра обработки данных, содержащая пару десятков серверов.
Внутри стойки мы резервированы и устойчивы, каждый сервер имеет 2 диска и может выдержать отказ одного.
Наши серверы хранения данных имеют 3+ диска и могут выдержать один отказ. Мы также быстро ремонтируем / заменяем сломанное оборудование. У каждого сервера есть по крайней мере один реплицированный партнер, и мы можем потерять 1 или 2 из каждого кластера (т.е. веб, базу данных, хранилище).
Подключение к Интернету обеспечивается 2 каналами 100 Мбит / с через Ethernet к нашему основному провайдеру транзита, которые подключаются к паре межсетевых экранов Cisco ASA5500 в паре аварийного переключения высокой доступности. Проблема не в этом.
На мой взгляд, два больших SPOF выглядят следующим образом:
1) Наш Интернет идет от одного транзитного провайдера. Если их сеть выходит из строя, мы отключаемся от Интернета. Поскольку мы находимся в центре обработки данных, нейтральном к оператору связи, довольно легко получить второй IP-транзит.
2) Если что-то случится с электричеством в нашем центре обработки данных, значит, нас тоже нет.
В идеале мне бы хотелось, чтобы серверы в 2 центрах обработки данных использовали разные маршруты через нескольких провайдеров IP-транзита, объявляя их через BGP.
Во втором центре обработки данных я бы использовал 2 маршрутизатора серии cisco 28xx, 2 межсетевых экрана ASA 5500, пару коммутаторов портов Catalyst 48 и около дюжины серверов Dell. Примерно в соответствии с основным местоположением.
Руководство утверждает, что этот подход связан с огромными расходами, а маршрут BGP чрезмерно дорогим. В то время как они, кажется, счастливы иметь второе место, BGP, похоже, не используется.
Последняя расценка на множественную адресацию составила около 80 тысяч фунтов стерлингов. (Возможно, они просили расценки на позолоченные Ciscos!)
Вместо этого руководство считает, что с этим лучше справиться с помощью решения на основе DNS, где наша маршрутизация контролируется службой мониторинга времени безотказной работы (например, pingdom), которая изменяет наши записи DNS (с TTL 1 с), чтобы указать на альтернативное местоположение. в случае сбоя сервера.
Множество компаний используют BGP по какой-то причине, это решение DNS просто не собирается его сокращать, особенно с учетом того, что многие интернет-провайдеры и так далее фактически игнорируют короткие TTL и заменяют их более длинными.
Вопросы:
1) Может ли кто-нибудь порекомендовать хороший нейтральный центр обработки данных в Западной Европе (Амстердам и т. Д.) Или в восточной части США (округ Колумбия, Вирджиния, Нью-Йорк и т. Д.)?
2) Кто-нибудь заставил это решение DNS работать должным образом, или это просто безумие?
3) Неужели я единственный, кто думает, что цена в 80 тысяч фунтов на множественную адресацию (в одном месте) кажется абсолютно чрезмерной?
4) Есть ли у кого-нибудь хороший способ убедить руководство, что BGP - единственное реальное решение?
Извинения за длину ..: o)
Что ж, вы правы, DNS определенно не является ответом - возьмите это у кого-то, кто использовал многосетевые сети Интернет-провайдера, а теперь использует DNS для жизни.
Для чего была предложена квота в размере 80 тысяч фунтов стерлингов - только BGP и дополнительный транзитный канал или также для необходимых маршрутизаторов Cisco? 2800-е, которые вы сейчас перечисляете, вероятно, не способны выполнять полную таблицу маршрутизации - в настоящее время в глобальной таблице BGP4 имеется более 200 тыс. Маршрутов, и для этого требуется много памяти маршрутизатора.
Прошло пару лет с тех пор, как я делал это по-настоящему, но на самом деле получение BGP от транзитных поставщиков не должно быть дорогостоящим - действительно, более крупные поставщики ожидают, что BGP будет частью услуги, особенно если вы используете 100+ Мбит / с. .
Кроме того, где сейчас находится главный центр обработки данных? Вам не обязательно нужно огромное разнообразие - у моей сети изначально было два DC в Лондоне - один в городе и один в Доклендс, примерно в 10 км друг от друга. Этого достаточно, чтобы исключить практически любое стихийное бедствие.
Если у вас есть оба сайта в Лондоне, есть несколько компаний, которые предлагают дешевые Ethernet-соединения между многими центрами обработки данных в городе. Один из самых известных - Datahop - они делают связи между сайтами со скоростью 1 Гбит / с примерно за 4 тысячи фунтов стерлингов в год.
Точно так же и для резервного сайта, если вы хотите, чтобы вторая транзитная линия использовалась только в чрезвычайных ситуациях, я видел глупо низкие цены от подобных Cogent по 5 фунтов за Мбит / с / см. Я бы не стал использовать их в качестве основных, но в качестве крайней меры их стоит рассмотреть.
Мой предыдущий работодатель работает в одном из офисов Equinix в Нью-Джерси. Они казались вполне довольными этим, когда я работал на них. Кроме того, извините, я мало что делаю в этой части мира.
Отработка отказа DNS - отстой. Как вы определили, существует достаточно провайдеров, которые игнорируют TTL DNS, и отказоустойчивость DNS вызовет изжогу руководства при первом же возникновении.
Да, это бешеные деньги для множественной адресации BGP.
Не зная психологии вашего руководства, я не могу предложить много конкретного. Найдите нелепую цитату для BGP и напомните им, сколько на самом деле стоит иметь полностью избыточное средство - это намного больше, чем они, по-видимому, думают, особенно когда вы добавляете необходимость проводить регулярные тесты переключения при отказе, чтобы убедиться, что все в порядке. работает должным образом.
Кроме того, проведите разумный анализ сценариев и вероятностей отказов, а также того, сколько на самом деле стоит один из таких случаев. Может оказаться, что несколько часов простоя каждые несколько лет из-за отключения электроэнергии - это намного меньше, чем резервное оборудование. Часто руководство (или технические специалисты) прибегают к «избыточному весу», что не имеет никакого экономического смысла.
Наконец, помните, что большинство отключений на самом деле вызвано человеком, поэтому отказоустойчивые сайты и вся эта дополнительная сложность могут увеличение шансы не уменьшаются.
Всего несколько быстрых мыслей;
Простое и хорошее решение: наш сайт электронной коммерции среднего размера использует Zoneedit DNS для отработки отказа и AlertFox для тестирования транзакций. Если исключить перерывы на 1-3 минуты при переключении, наши вверхвремя в этом году было 100%. Стоимость: 20 долларов в год (?) Для Zoneedit и 199 долларов в месяц для AlertFox PRO3. Плюс два выделенных сервера.