Кто-нибудь знает о песочнице, в которой уже настроена среда для обработки больших данных?
Это может быть хадуп, кассандра, свинья и т. Д.
Я программист sql-сервера и пытаюсь разобраться в решениях big data / nosql, но мне очень трудно настроить свою собственную среду в Linux.
Существуют ли какие-либо бесплатные / платные сервисы, которые позволяют загружать большие данные, играть с ними и настраивать кластеризацию?
Amazon, Windows Azure.
Вы можете легко получить 100 или 1000 виртуальных машин за короткое время.
Проблема с любой такой внешней вещью заключается в том, что «большие данные» трудно перемещать. Обработка большого объема данных - это просто, но как получить терабайты данных в Amazon для тестирования?