Назад | Перейти на главную страницу

Как запустить сценарий оболочки в Google Compute Engine, когда новый файл загружается в корзину облачного хранилища

Я создаю программу, которая обрабатывает файлы csv и извлекает из них данные с помощью сценария оболочки всякий раз, когда пользователь загружает файл в корзину хранилища Google. Пользователи могут загружать файлы любое количество раз в день, и они должны обрабатываться немедленно. Как я могу этого добиться?

Вы можете создать Cron Job и запускайте скрипт через равные промежутки времени или каждую минуту, если хотите. Чтобы проверить, загружен ли новый файл, и обработайте файлы csv для извлечения данных с помощью созданного вами сценария оболочки.

Если у вас есть программа, которая будет обрабатывать файлы csv на машине Linux, вы можете сделать это:

  1. Создайте пользователь IAM, чтобы получить доступ к корзине с CSV.
  2. Установить gsutil на вашем Linux и настройте доступ с помощью Я пользователь.
  3. Создайте сценарий оболочки с помощью команды gsutil rsync, например, Вот документация.

    gsutil rsync -d -r bucket local_dir

  4. С помощью этой команды вы можете синхронизировать корзину с локальной папкой и наоборот, поэтому будут загружены только новые файлы, вы можете делать это каждую минуту или где угодно.

  5. Обработайте новые файлы CVS