Я использую систему AWS EC2 с общим разделом NFS между экземплярами (5x m3.medium). Я загружаю постоянно увеличивающийся двоичный файл со скоростью ~ 10 раз ниже моей максимальной пропускной способности (загрузка 250 КБ на канал 2,5 МБ), используя rsync --append
. Одновременно я анализирую файл в разделе NFS и распределяю эти вычисления с помощью MPI.
Пока rsync
не запущен, анализ с использованием MPI работает нормально, на выполнение двоичного файла требуется ~ 5 секунд. Пока rsync
работает, MPI-связь между экземплярами достигает обхода, что занимает несколько часов для выполнения той же задачи. Скрипт анализа занимает больше всего времени при MPI_File_read_at()
команды, читающие двоичный файл в общем разделе NFS. Когда я прекращаю rsync
и повторите анализ, скорость нормальная.
Я работал над этим вопросом несколько дней и не добился большого прогресса. Я не уверен, что проблема заключается в использовании MPI на rsync
ing файл, или файл, обновляемый через NFS, или что. Я значительно ограничил пропускную способность для rsync (rsync --bwlimit=X
), а замедление все равно происходит.
У меня нет большого опыта работы с этими инструментами, я просто пытаюсь получить систему, которая работает в данный момент. Если кто-нибудь знает, что может вызвать эту задержку или другие несовместимости между этими методами, которые я использую, я был бы признателен за совет.