Сколько ресурсов на стороне сервера мне понадобится, чтобы создать веб-сайт с более чем 200 миллионами просмотров страниц в месяц, каждая страница имеет размер около 400 КБ, может ли кто-нибудь помочь мне разобраться или оценить?
Сколько серверов мне нужно? Какой хороший провайдер, я знаю некоторых, но просто хочу увидеть разные варианты
200 миллионов просмотров на странице размером почти пол мегабайта, что соответствует пятнадцати разные баз данных, а приложение написано на Рельсы? Гав.
Первая проблема, с которой вы столкнетесь, - это неприличная страница размером 400 КБ. Главная страница Serverfault, на которой отображается 50 вопросов на странице, составляет 19 КБ. CNN.com содержит целых 21k изображений и прочего. Чтобы даже рассматривать выполняя 200 миллионов просмотров страниц в день, вам придется держать эту страницу под контролем. 200 миллионов x 400 тыс. = 74,5 терабайты. В ДЕНЬ. Большинство мест, которые размещают, размещают в терабайтах на месяцне петабайты в месяц. Вы перейдете на территорию Google только с 1% просмотров страниц.
Вторая проблема, с которой вы столкнетесь, заключается в том, что Rail нелегко запрограммировать таким образом, чтобы сайты масштабировались линейно. Я не буду заходить так далеко, чтобы сказать, что он не масштабируется, но у многих людей возникли проблемы с этим, и вам нужно будет уделить этому дополнительное внимание.
Третья проблема - ваши базы данных. 15? В самом деле? Этого нельзя допустить. Вам нужно будет рассмотреть вопрос о денормализации, начать работать над тем, как построить звездные таблицы из разрозненных баз данных и сократите это число. Базы данных - это места, где есть проблемы и вы захотите минимизировать количество отслеживаемых вами объектов соединения в любой момент времени.
Пока у вас нет этого под рукой, нет смысла искать оборудование или хостинг. Вы можете использовать столько оборудования, сколько захотите.
Возможно, это прозвучит жестко, но для такого ожидаемого уровня использования вам нужно нанять человека / людей для разработки масштабируемости.
Для начала вам нужно убедиться, что вы кэшируете нужные типы данных в нужных местах в цепочке. Вам необходимо обеспечить его безопасность, отказоустойчивость и поддержку. Вам необходимо принять во внимание настройку SAN, сценарии сбоев, потоки трафика, точки ограничения полосы пропускания, стратегию обслуживания, системы резервного копирования и аварийного восстановления, а также то, что я могу придумать для себя.
Также вам нужно рассчитать, делать это с выделенным комплектом или с общим, общий может легко обойтись дороже с этой нагрузкой.
В принципе, если вы планируете построить что-то такого размера, но задаете такой вопрос, это не означает оскорбления, но вам нужна дополнительная помощь.
Похоже, вы все еще начинаете. На самом деле существует так много переменных, что невозможно сказать заранее, какое оборудование вам понадобится.
Вероятно, лучше всего начать с малого, быть гибким, измерять все показатели, быстро реагировать и поддерживать тесную связь между разработчиками и операторами.
Будьте готовы к перестройке, возможно, несколько раз. 200 миллионов просмотров страниц в день - это что-то, но в хорошо продуманной среде это вполне выполнимо даже при ограниченном бюджете.
Что касается провайдера, попробуйте найти того, который имеет некоторую репутацию и соответствует вашей сфере деятельности / специальностям. Решите, хотите ли вы заниматься сетью, заменой оборудования, развертыванием ОС, операциями, мониторингом или вы хотите оставить это провайдеру. Кроме того, не выбирайте самые дешевые.
Если есть более конкретные вопросы, стреляйте.
Очень рекомендую забрать:
Масштабирование до миллионов посетителей в день - нетривиальная задача и потребует серьезного планирования и нагрузочного тестирования. Википедия, например, управляет клеткой примерно из 350 серверов в объекте совместного размещения в Тампе, Флорида (я видел это; у меня там тоже есть серверы), на котором работает один из самых посещаемых сайтов в мире. . Их архитектура сильно отличается от таких сайтов, как Facebook, на которых, по оценкам, работает около 60 000 серверов в различных центрах обработки данных по всему миру.
Хорошо, для получения дополнительной информации, приложение написано на Rails, для получения данных со страницы задействовано примерно 15 различных больших баз данных, страница представляет собой смесь текста, изображений и различных приложений, созданных на флэш-памяти.
Мне просто нужны подсказки, чтобы оценить серверы, которые мне нужны, я знаю, что вначале мне понадобится небольшой сервер, но я ожидаю больших темпов роста, поэтому не могли бы вы дать мне несколько примеров того, сколько серверов используют определенные страницы, например, espn .com или cnnsi.com, facebook или что-то в этом роде.