У меня есть несколько примеров баз данных, но они довольно маленькие по размеру. Я хочу создать базу данных с записями до 50 ГБ. Я хочу изучить многие аспекты базы данных, а также протестировать производительность нашего приложения.
Как собрать случайные данные?
Просто напишите множество подходящих вставок со случайными данными.
Я не могу быть более конкретным, поскольку вы ничего не говорите нам о своей базе данных.
Ряд источников в Интернете позволяют загружать их контент, и он часто достигает десятков или сотен ГБ. Два, о которых я могу подумать, это:
Хотя эти дампы представлены в формате XML, они легко импортируются в пустую базу данных любой современной СУБД. На ряде других сайтов также есть свалки, особенно на вики-сайтах (как в обоих этих примерах).
Вы можете использовать некоторые API Faker, например этот: http://faker.rubyforge.org/
Или, если вам нужны реальные данные, вы можете собрать их из Интернета, несколько месяцев назад мне были нужны реальные данные для тестов, я сделал IRC-бота, который регистрирует все сообщения на 10 лучших каналах на Freenode и позволяет ему работать 24 часа в сутки для многих. недель, что дало мне много данных (~ 1 миллион строк) :)