Назад | Перейти на главную страницу

Быстрая и надежная передача данных из / в Китай

Мы небольшая компания, и в ближайшем будущем нам потребуется передавать довольно большие объемы данных (10 ГБ + каждый раз) между Европой и Китаем.

Как многие, возможно, уже испытали, Интернет-соединения в Китай или из Китая могут быть довольно ненадежными и медленными, временами без какой-либо очевидной причины. Например, хотя отправка данных в Китай через FTP обычно работает хорошо, в обратном направлении она может быть очень медленной.

В настоящее время мы изучаем новые способы обеспечения высокой скорости передачи в обоих направлениях. Пока мы попробовали:

  1. FTP (см. Выше)
  2. FTP через службы VPN (обычно медленнее, чем прямые соединения)
  3. F2F (как Retroshare или Freenet - медленно !!)
  4. Аспера (быстро, но дорого!)
  5. BitTorrent (недоступные конечные узлы, b / c межсетевых экранов, которые мы не должны настраивать)

Хотим попробовать:

  1. Облачное хранилище (например, Amazon S3, Google Storage) - всегда ли эти службы надежно доступны из Китая?
  2. Point-to-Point VPN (в настоящее время невозможно, b / c сети, см. Выше)

Буду особенно благодарен людям, которые уже сталкивались с подобными проблемами раньше.

Я бы предложил использовать rsync делать такого рода переводы. Он может использовать ssh для шифрования трафика (поэтому вам не нужно использовать отдельную VPN), сжимает поток (что может быть довольно эффективным в зависимости от вашего типа данных) и может перезапустить передачу, если они не удались (он использует скользящую контрольную сумму, чтобы узнать местонахождение передача не удалась и с чего начать заново).

Я использую следующее, что включает в себя вышеизложенное (поскольку клиент rsync на моих / большинстве машин по умолчанию использует ssh):

rsync -avz <local file> username@hostname:/path/where/to/place/file/<remote file>

Ты можешь использовать --progress чтобы увидеть на терминале, как идет перевод. Обычно это ssh и использует локальную машину rsync client, но есть также демон rsync. Я никогда не использовал его, но стоит разобраться, нужен ли вам настоящий демон, похожий на ftpd.

Поскольку он использует SSH, вы также можете изменить используемые им порты, если брандмауэры заблокируют их. то есть вам не нужно, чтобы ssh прослушивал порт 22 (на самом деле я не хочу, чтобы случайные люди в Интернете сканировали мой SSH).

Обычно он используется в системах Unix (включая Mac), но вы можете установить его с помощью Cygwin также, если вам нужно использовать его в Windows.

Если вам нужен реальный сервис, я использую rsync.net которые, что довольно очевидно, предоставляют хранилище, в которое вы можете легко выполнить синхронизацию данных. У них есть европейский центр обработки данных в Швеции, который соответствует вашим целям и не ограничивает скорость входящего / исходящего трафика (хотя проверьте мелкий шрифт).

Я предлагаю вам протестировать физическую отправку диска или флэш-накопителя в Китай, чтобы понять, сколько времени и сколько потребуется, чтобы отправить данные через транспортную компанию. Пропускная способность ОГРОМНАЯ с точки зрения данных. Вы можете зашифровать и отправить несколько отправлений, чтобы обеспечить избыточность и защиту, и у вас нет инфраструктуры для обслуживания.

Некоторые из вас спрашивали, на чем мы наконец остановились.

Хотя мы опробовали и протестировали почти все предложенные выше решения, использование проприетарного протокола и программного обеспечения Aspera, похоже, лучше всего подходит для наших целей.

Может быть, кто-то еще знает что-нибудь получше и хотел бы этим поделиться?

Думаю, вам нужна распределенная файловая система.

Ceph представляет собой платформу хранения бесплатного программного обеспечения, которая реализует объектное хранилище в едином распределенном компьютерном кластере и предоставляет интерфейсы для хранения на уровне объектов, блоков и файлов. Ceph в первую очередь нацелен на полностью распределенную работу без единой точки отказа, масштабируемую до эксабайтного уровня и свободно доступную.

Ceph реплицирует данные и делает их отказоустойчивыми, используя обычное оборудование и не требуя специальной аппаратной поддержки. Благодаря своей конструкции система является как самовосстанавливающейся, так и самоуправляемой, что позволяет минимизировать время администрирования и другие расходы.