Назад | Перейти на главную страницу

Разница между Amazon S3 Select и Amazon Redshift Spectrum

Amazon Redshift Spectrum позволяет выполнять запросы непосредственно к вашим данным, хранящимся в Amazon S3. Похоже, в этом и заключается цель новой службы Amazon S3 Select. В чем основные различия между этими двумя сервисами? Почему я должен предпочесть одно другому?

S3 Select ориентирован на получение данных из S3 с помощью SQL:

S3 Select позволяет приложениям извлекать из объекта только часть данных с помощью простых выражений SQL. Используя S3 Select для извлечения только тех данных, которые необходимы вашему приложению, вы можете добиться резкого повышения производительности - во многих случаях вы можете получить улучшение на 400% по сравнению с классическим извлечением S3.

Redshift Spectrum позволяет запрашивать данные S3 непосредственно из кластера AWS Redshift:

Amazon Redshift Spectrum позволяет выполнять запросы Amazon Redshift SQL к эксабайтам данных в Amazon S3. С Redshift Spectrum вы можете расширить аналитические возможности Amazon Redshift за пределы данных, хранящихся на локальных дисках в вашем хранилище данных, для запроса огромных объемов неструктурированных данных в вашем «озере данных» Amazon S3.

Athena ориентирована на извлечение, преобразование и загрузку (ETL) данных из S3 и имеет хорошую интеграцию с AWS Glue:

Афина проста в использовании. Просто укажите на свои данные в Amazon S3, определите схему и начните запрос с использованием стандартного SQL. Большинство результатов доставляются за секунды. С Athena отпадает необходимость в сложных задачах ETL для подготовки данных к анализу. Это позволяет любому, кто обладает навыками SQL, быстро анализировать крупномасштабные наборы данных.

Ссылки: Афина, Спектр и S3 Выбрать