Назад | Перейти на главную страницу

Передача большого количества небольших файлов

Мне нужно выполнить миграцию двух серверов с большими подключениями SAN в нашу новую среду VMWare.

РЕДАКТИРОВАТЬ: Я должен предоставить некоторые дополнительные сведения, поскольку у меня есть хорошие ответы относительно решения VMWare.

Итак, я не могу подключить предыдущий LUN EMC к новой системе из-за ограничений некоторых технологий на сервере.

Я не могу использовать VMWare Converter для клонирования отсутствующих томов на моей новой виртуальной машине, поскольку VMWare Converter не может видеть псевдоустройства EMC PowerPath и предыдущий администратор использовал эти псевдоустройства для создания томов LVM2 и / или ASM поверх.

Эти два физических сервера подключены к старой сети хранения данных EMC² CX-340 и обрабатывают 5 ТБ данных.

Эти 5 ТБ данных представляют собой небольшой PDF-файл, и мне нужно передать их на новый компьютер через нашу локальную сеть 1 Гбит / с.

Я пробовал использовать rsync, но он действительно медленный и сильно влияет на производительность оперативной памяти и процессора.

Я пробовал использовать NC с TAR, но скорость передачи довольно низкая, так как у меня средняя пропускная способность около 50 МБ / с на канале 1 Гбит / с с практически нулевым трафиком.

Не могли бы вы дать мне несколько советов или поделиться своим опытом с такого рода миграцией, и как вам удается завершить ее правильно в разумные сроки?

Если вам действительно нужен быстрый способ передачи файлов, и обе системы основаны на Linux, вы можете попробовать UDR.

Это действительно форма rsync-over-UDP (с использованием open-source Фреймворк UDT) и особенно удобен для перемещения большого количества файлов или передачи по каналам с высокой пропускной способностью или высокой задержкой. Кроме того, шифрование по умолчанию отключено, поэтому нагрузка на ОЗУ / ЦП ниже, чем у традиционного rsync. SSH тоже не задействован.

Я легко могу получить телеграфные переводы более 1 Гбит / с с 10 миллионами маленьких файлов TIFF в дереве каталогов.

Ваш синтаксис будет немного изменен по сравнению с rsync. Все флаги rsync должны стоять перед спецификацией источника / назначения:

udr rsync -avP --stats --delete /data/ server2:/data/

Легко построить ... Вам понадобится g++ и openssl-devel:

git clone https://github.com/LabAdvComp/UDR.git
cd UDR/
make
cp src/udr /usr/local/bin/

Сделайте это в источнике и месте назначения.


Видеть: Возможность оптимизации WAN для SSH трафика

При использовании в режиме демона без шифрования rsync может эффективно передавать большое количество небольших файлов. Дайте ему еще одну попытку, используя его в режиме демона.

Разве вы не думали о том, чтобы предоставлять LUN-ы SAN напрямую новым виртуальным машинам - это обычно работает нормально и может быть быстрее, чем копирование файлов в VMDK, хотя это может «заблокировать» виртуальные машины на их исходном хосте. Но вы можете использовать это, чтобы начать работу, а затем перенести файлы в VMDK в своем собственном темпе - с помощью rsync - а затем обрезать ссылку на исходные LUN.

Если целевые виртуальные машины еще не созданы, вы можете попробовать использовать бесплатный VMware Converter для копирования данных.

Фактически, даже если они созданы, вы можете клонировать диски на фиктивную виртуальную машину, а затем присоединить их к существующей виртуальной машине после завершения клонирования.

В любом случае конвертер использует два метода для клонирования файлов из источника в место назначения, полную информацию о которых можно найти. Вот.

Если целевые диски настроены как меньше чем исходный, он будет клонировать отдельные файлы в новую виртуальную машину.

Однако, если целевые диски настроены как равно или больше, он клонирует блоки. Это сделает количество файлов на диске в значительной степени несущественным, и он должен работать относительно быстро.

Я сомневаюсь, что вы заполните канал 1 Гбит / с, но вы должны получить более 50 Мбит / с.

Просто помните, что вы все еще хотите переместить 5 ТБ, поэтому это займет некоторое время.