Я использую rsync поверх ssh для резервного копирования данных из Windows в Linux. Это создает 1 процесс rsync на сервере для каждого соединения, так как это выполняется по ssh. Каждое соединение rsync работает со скоростью 1 Мбит / с. У вас есть представление о том, сколько из этих подключений я могу установить на машине с оперативной памятью 2 ГГц - 4G, прежде чем процессор достигнет 100%. Я не смог найти в Интернете никакой хорошей информации по этому поводу.
Лоран
Rsync делает не линейно масштабируются, особенно если они не запускаются одновременно. Самая интенсивная часть - это начальный бит, где он читает каталоги и синхронизирует списки файлов. Самая новая версия rsync делает это, поэтому у вас останутся только контрольные суммы. Если загрузка ЦП становится проблемой, вы также можете отключить эту часть.
Сторона SSH обычно не использует слишком много ЦП, даже если вы начинаете серьезно увеличивать пропускную способность. Он очень оптимизирован и мало что делает. Для записи, я проталкивал 45 мегабайт в секунду через зашифрованный туннель ssh, при этом ни одно из ядер на коробке не мигало. Немного подскочила нагрузка из-за доступа к диску при выталкивании данных в массив raid.
Довольно много, если вы можете настроить клиентов, чтобы не использовать rsync одновременно.
Но я бы не нервничал по поводу ЦП / ОЗУ, так как я думаю, что узким местом будет пропускная способность жестких дисков.
В любом случае следуйте советам sysadmin1138 и следите за ресурсами с помощью простого инструмента, такого как gkrellm (который может показать вам ЦП, ОЗУ, жесткие диски и сеть одновременно).
Я бы начал проводить масштабные испытания. Запустите один процесс, проверьте его загрузку процессора и памяти в диспетчере задач. Выполните четыре параллели и сделайте то же самое для каждого. Предполагая, что это линейно масштабируется, вы должны получить четкое представление о том, когда вы начнете достигать пределов ЦП / ОЗУ. Если он не масштабируется линейно, вам нужно получить больше точек данных и выполнить математические вычисления.
Основным узким местом, скорее всего, будут ваши диски, а не процессоры. rsync
это инструмент для копирования файлов. Тот факт, что он также выполняет шифрование, является плюсом, но большую часть времени он будет тратить на чтение дисков.
Самые важные показатели - это не скорость вашего процессора, а скорость вашего диска. Если вам нужна большая скорость, вы должны использовать какой-то RAID.
По мнению других, лучший способ решить эту проблему - просто протестировать.
Однако я не верю, что вы достигнете пределов своего процессора или оперативной памяти до того, как система станет непригодной для использования из-за нагрузки ввода-вывода, которую вы на нее возлагаете.
Я также не верю, что он будет масштабироваться линейно, я бы ожидал достичь точки, когда запуск действительно дополнительного rsync замедлил его.
Если вы действительно хотите что-то протестировать, я бы проверил, сколько из них вы можете запускать одновременно, прежде чем это станет медленнее, чем запускать их по одному. На обычных sata-дисках я ожидал, что это число будет меньше дюжины.