Назад | Перейти на главную страницу

Использование раздела NFS в системе AWS EC2. Загрузка файлов с помощью rsync замедляет экземпляры

Я использую систему AWS EC2 с общим разделом NFS между экземплярами (5x m3.medium). Я загружаю постоянно увеличивающийся двоичный файл со скоростью ~ 10 раз ниже моей максимальной пропускной способности (загрузка 250 КБ на канал 2,5 МБ), используя rsync --append. Одновременно я анализирую файл в разделе NFS и распределяю эти вычисления с помощью MPI.

Пока rsync не запущен, анализ с использованием MPI работает нормально, на выполнение двоичного файла требуется ~ 5 секунд. Пока rsync работает, MPI-связь между экземплярами достигает обхода, что занимает несколько часов для выполнения той же задачи. Скрипт анализа занимает больше всего времени при MPI_File_read_at() команды, читающие двоичный файл в общем разделе NFS. Когда я прекращаю rsync и повторите анализ, скорость нормальная.

Я работал над этим вопросом несколько дней и не добился большого прогресса. Я не уверен, что проблема заключается в использовании MPI на rsyncing файл, или файл, обновляемый через NFS, или что. Я значительно ограничил пропускную способность для rsync (rsync --bwlimit=X), а замедление все равно происходит.

У меня нет большого опыта работы с этими инструментами, я просто пытаюсь получить систему, которая работает в данный момент. Если кто-нибудь знает, что может вызвать эту задержку или другие несовместимости между этими методами, которые я использую, я был бы признателен за совет.