Мы стартап, стремящийся запустить нашу систему семантического поиска для резюме. Система должна предоставлять ответы на запросы api для поиска резюме, просматривая данные инвертированного индекса размером около 25 ГБ (это не инвертированные текстовые индексы, а, скорее, индексы навыков с соответствующими рангами и поэтому требуют вычислений и «разработки с нуля», а не используя такую библиотеку, как lucene и т. д.). Приложение написано на python, и оборудование, которое мы используем, должно предоставить следующее:
а. 32 ГБ ОЗУ, чтобы мы могли хранить в памяти 25 ГБ данных для обслуживания запросов в режиме реального времени. б. Возможность обрабатывать 3-4 одновременных подключения. c. Способность обрабатывать около 1000-1500 API-вызовов в день. Каждый запрос API вызывает поиск по данным в памяти и возвращает результаты на основе определенных алгоритмов сопоставления и ранжирования. d. Требования к времени безотказной работы не очень строгие. Поскольку мы будем находиться в стадии бета-тестирования в течение некоторого времени (скажем, 6 месяцев), мы можем позволить себе время безотказной работы до 95%, если это может привести нас к более дешевому решению.
Требуются данные о том, стоит ли нам переходить на 1. Серверную систему (главный недостаток - дорогостоящий, а деньги важны для стартапов) 2. Настольное решение с платой, поддерживающей 32 ГБ (не удалось найти 1 в Индии, где мы находимся. исходя из максимума, который мы получаем, составляет 16 ГБ. Основное преимущество - стоимость. Главный недостаток - меньшая, чем согласованность на сервере) 3. Хостинговое решение (основной недостаток - стоимость выделенного сервера 32 ГБ).
Заранее спасибо.
Несколько приблизительных цифр и комментариев. Обратите внимание, что значения взяты из Северной Америки, и я не знаю, как это соотносится с чем-либо в Индии.
Не зная больше о вашем приложении / бизнесе, я бы начал с небольшого / базового выделенного сервера, арендуемого ежемесячно, или меньшего экземпляра Amazon EC2, особенно если вы беспокоитесь о том, чтобы потратить несколько тысяч на более крупную машину. Посмотрите, как этот небольшой сервер работает или не работает, и посмотрите, возможно ли масштабирование. Если нужно, начните добавлять больше небольших серверов / экземпляров по мере необходимости для достижения целей производительности / бюджета.
это зависит от того, сколько денег у вашего стартапа.
Почему бы не использовать для этого инстанс Amazon EC2? он будет соответствовать вашим требованиям?
Если вы хотите купить собственный сервер, вы можете приобрести dell R410 или dell R510, который будет соответствовать этому требованию.
Вы также хотите подумать, как вы будете масштабироваться, если станете успешными.