Получение доступа к большим данным без настройки среды

Кто-нибудь знает о песочнице, в которой уже настроена среда для обработки больших данных?

Это может быть хадуп, кассандра, свинья и т. Д.

Я программист sql-сервера и пытаюсь разобраться в решениях big data / nosql, но мне очень трудно настроить свою собственную среду в Linux.

Существуют ли какие-либо бесплатные / платные сервисы, которые позволяют загружать большие данные, играть с ними и настраивать кластеризацию?

Amazon, Windows Azure.

Вы можете легко получить 100 или 1000 виртуальных машин за короткое время.

Проблема с любой такой внешней вещью заключается в том, что «большие данные» трудно перемещать. Обработка большого объема данных - это просто, но как получить терабайты данных в Amazon для тестирования?