Назад | Перейти на главную страницу

Лучший вариант для обеспечения высокой доступности между удаленными центрами обработки данных?

Мы пересматриваем системные требования, которые нам предъявил новый клиент. Они работают в области медицины и в системе, которую они хотят, чтобы мы разместили. должен быть как минимум высокодоступным и предпочтительно отказоустойчивым.

Мы рассматриваем возможность лицензирования VMWare Enterprise, чтобы получить их функции HA и FT с оборудованием, совместимым с FT. Ничего особенного - Ethernet 10 Гбит / с дешевеет, а Ethernet 1 Гбит / с не является проблемой.

Однако одним из требований клиентов является наличие у нас HA (не FT, но FT было бы неплохо) сайта, который находится в совершенно другом городе.

Пропускная способность в Австралии составляет псих дорого, и я даже не знаю, возможно ли получить канал 1 Гбит / с между Сиднеем и Мельбурном (примерно 1000 км / 600 миль друг от друга). Я, вероятно, изо всех сил пытаюсь установить соединение со скоростью 100 Мбит / с между двумя городами.

Какие у меня варианты предоставления системы высокой доступности? Необязательно быть с VMWare, но если один сайт выйдет из строя, мне нужно иметь возможность войти на второй сайт, нажать кнопку «Пуск» и начать работу.

В настоящее время я нахожусь на начальных этапах планирования / реализации настройки удаленного центра обработки данных DR / HA за $ WORK. Наша текущая среда уже является высоко виртуализированной как с точки зрения виртуализации серверов (VMware), так и виртуализации хранилищ (Compellent SAN). Таким образом, мы думали, что имеет смысл использовать как эти технологии, так и решения высокой доступности, которые у них есть.

Все наши тома VMFS в настоящее время находятся в Compellent SAN, и мы будем использовать их асинхронную репликацию томов, чтобы поддерживать относительную синхронизацию (вероятно, каждые 15 минут) в другом SAN на удаленном сайте. Затем для самих виртуальных машин мы используем SRM VMware. Довольно крутой продукт, о котором, я думаю, вы слышали. Если вы хотите, он может в значительной степени абстрагировать / автоматизировать переключение на ваш вторичный центр обработки данных одним нажатием кнопки. Довольно ловко.

К счастью для нас, у нас есть связь GigE между сайтами, которые мы будем использовать для репликации SAN (среди прочего). При синхронизации каждые 15 минут дельты громкости в нашем случае не будут такими большими. В зависимости от того, сколько оттока имеет системы вашего клиента, может быть не так уж сложно поддерживать синхронизацию по каналу 100 Мбит / с (или даже меньше). Я знаю других клиентов Compellent, которые синхронизируются через один T1. Очевидно, там не происходит большого количества изменений данных ...

В любом случае, вот несколько вещей, которые следует принять во внимание:

  • Будьте осторожны со своими свопами. Их, скорее всего, не нужно тиражировать. Конечно, системы на дальнем конце воля нужны логические файлы подкачки, но вы, вероятно, сможете переназначить эти виртуальные машины только локальным логам. Таким образом, вам не придется беспокоиться о накладных расходах на репликацию бесполезных данных.
  • Убедитесь, что у вашего поставщика SAN есть план восстановления после сбоя. Вы же не хотите «застревать» в своей производственной среде, работающей на резервном сайте, в течение нескольких месяцев, потому что вы не можете понять, как восстановить синхронизацию на основном сайте.
  • Это само собой разумеется, но тестируйте, проверяйте, проверяйте. VMware SRM делает это очень прост в исполнении и может предоставить вам хорошие отчеты об испытаниях аварийного переключения, которые можно передать в PHB.
  • IP-адресация. В нашем случае у нас есть 802.1QinQ, работающий между сайтами, поэтому переадресация серверов при работе на резервном сайте (к счастью) не потребуется. Тем не менее, это требует, чтобы реклама BGP (с соответствующими весами) с каждого сайта, а также правила брандмауэра поддерживались на каждом сайте, чтобы при переходе трафика на резервный сайт все работало должным образом.

Это все, что у меня есть на данный момент. Через шесть месяцев, когда я (надеюсь) близок к завершению нашей системы аварийного восстановления, я уверен, что узнаю еще много вещей. :) Удачи и приятного времяпровождения!

В $ WORK мы оцениваем VMWare SRM на HP P4000 SAN (AKA LeftHand).