Назад | Перейти на главную страницу

варианты хранения относительно большого количества данных

В настоящее время я провожу небольшое исследование для транснациональной компании в рамках своей диссертации. По правде говоря, я больше похож на программиста / программиста, так что я здесь не совсем в своей тарелке. У меня вопрос: какие существуют варианты хранения средних и больших объемов данных? Подумайте о 4,5–5 ТБ прямо сейчас, хотя со временем этот объем, вероятно, будет неуклонно расти. Расположение людей и зданий не централизовано, примерно 50% находится в одном месте, оставшаяся половина распределена по разным странам по всему миру. Насколько я знаю, на этот носитель нужно поместить 2 сущности. Веб-приложения и несколько программ, последние, вероятно, могут быть предложены как SaaS.

Насколько я знаю, есть 3 варианта:

Звучит правильно, я что-то упускаю или даже делаю ошибку? Естественно, я не ищу на 100% полного ответа, в котором рассказывается абсолютно все по этой теме, хотя я был бы признателен за то, что помогло бы мне на моем пути.

Я почти уверен, что текущая ситуация такова: все данные хранятся в сторонней компании или в самом главном здании. Иностранные сотрудники получают все необходимое по удаленной связи. Не могу сейчас придумать конкретное слово.

Это зависит от того, что это за данные и как часто вы собираетесь загружать или выгружать их из хранилища. Что-то вроде YouTube с 5 ТБ видео будет иметь совершенно другие требования, чем 5 ТБ номеров социального страхования и финансовых данных. Что важнее, чтобы 5 ТБ был высокодоступным, или важнее, чтобы 5 ТБ были очень безопасными? Вы упомянули веб-сайт и приложение, которое можно использовать как SAAS; чем они написаны? это также может повлиять на ваш ответ. (Если веб-сайт и приложение являются LAMP, вы, возможно, не захотите хранить свои 5 ТБ в Microsoft SQL Server просто потому, что люди, которые знают разные стеки, с меньшей вероятностью будут иметь перекрестный опыт, если вы понимаете, что я говорю. )

Предполагая, что вы не собираетесь использовать CDN (что вы могли бы сделать, если 5 ТБ - это просто куча файлов, которые вы хотите обслуживать по запросу), для 5 ТБ я бы предложил выделенный сервер с выделенным хранилищем и предварительно разработанный способ осколок эти данные для будущего расширения. Однако, не зная, что это за данные, я в значительной степени догадываюсь.