Назад | Перейти на главную страницу

Кластер против виртуализации

Я работаю над выпуском веб-сайта видеохостинга (файлы с веб-камер) Размер каждого файла будет меньше 1 МБ. Я хотел бы иметь возможность легко увеличить емкость хранилища и обеспечить высокую доступность. Я буду использовать выделенные серверы от OVH с двумя сетевыми адаптерами (1 для WAN и 1 для частной сети). Мне нужно будет перекодировать видеофайлы, хранить информацию о пользователях в mysql и использовать apache для внешнего веб-сайта. Я начну с хранения 12 ТБ; и в следующие 6 месяцев потребуется 100 ТБ. Это даже было бы хорошей возможностью агрегировать пропускную способность каждого сервера. Я думаю о виртуализации с помощью proxmox или использовании glusterfs для хранения и использования двух серверов в HA для mysql + apache. Что было бы лучшим выбором?

Виртуализация здесь не особо полезна - она ​​заставляет одну большую машину работать как несколько маленьких. Вам нужна группа больших машин. Разделение физического хранилища хоста на несколько виртуальных машин вызовет у вас головную боль. Это также усложнило бы использование избыточности в кластерных файловых системах, поскольку вам нужно убедиться, что они не попадают на одни и те же физические диски.

Лучшая настройка, в зависимости от трафика, будет примерно такой:

  • Главный веб-сервер, обслуживающий страницы. Это может быть одна машина или несколько за балансировщиком нагрузки.
  • Сервер (ы) базы данных, которые в зависимости от нагрузки могут быть теми же компьютерами, что и веб-сервер, или отдельным компьютером или кластером.
  • Серверы хранения. Запустите на каждом из них легкий веб-сервер, например nginx, и обслуживайте файлы прямо оттуда. У каждого будет свой URL-адрес для обслуживания файлов.
  • Сервер (ы) транскодирования - который принимает исходные файлы, решает, на каком сервере хранения хранить вывод, и записывает его в базу данных. Разделение этого на отдельный сервер означает, что это не замедлит сканирование веб-сайта во время кодирования видео.

Когда вы начинаете, все они могут быть на одной и той же паре машин - по мере вашего роста разделите их на отдельные.

Кластерные файловые системы могут показаться проще, но при этом весь трафик проходит через главный сервер, что ограничивает вас.

Я подозреваю, что вы также недооцениваете, насколько тяжело администрировать кластерные файловые системы, если вы можете этого избежать. Кластерные файловые системы хороши, пока они не сломаются. У них действительно есть преимущества в добавлении дополнительной избыточности. И это единственный вариант, если вам нужно представить большой набор файлов в виде единой файловой системы, но я не думаю, что вам понадобится дополнительная сложность для этого использования.

На отдельных серверах хранения видео легко найти (просто запишите URL-адрес или сервер в базе данных). Решить, где хранить новые файлы, можно так же просто, как на каждом сервере запустить небольшой сценарий, который записывает свободное дисковое пространство в таблицу базы данных. один запрос скажет вам, где больше всего места, и вы переместите его туда через rsync или scp. Добавить новые серверы тоже легко - как только он записывается в эту таблицу, видео начинают поступать на него. Если вам нужна избыточность, выберите первые два сервера, скопируйте на оба и запишите основной и альтернативный серверы для каждого видео.