Я настроил конвейер данных, который импортирует файлы из корзины S3 в таблицу DynamoDB на основе предопределенного примера. Я хочу обрезать таблицу (или отбрасывать и создавать новую) каждый раз при запуске задания импорта. Конечно, это возможно с помощью AWS SDK, но я хотел бы сделать это только с помощью конвейера данных.
Возможно ли это сделать?
Спасибо за любую помощь
Я не уверен, что вам все еще нужно выполнять эту операцию, поскольку вы просили об этом много месяцев назад, но из-за отсутствия информации в Интернете по этой теме я решил создать учебное пособие и опубликовать его здесь, чтобы помочь другим людям, которые столкнулся с такой же ситуацией.
Это то, что у меня сработало.
В основном вам понадобится следующее:
Если все они у вас уже есть, то вперед!
Следуй этим шагам:
В своей корзине S3 вы можете предоставить все, что обрабатывает удаление данных в DynamoDB следующим образом:
java -jar /home/ec2-user/downloads/dynamodb_truncate_table-1.0-SNAPSHOT.jar
Это оно:
Надеюсь, это поможет вам, ребята