big-data – список вопросов по тегу – страница №1
Для небольших файлов хеширование вполне нормально, но для больших файлов вы можете легко найти md5sum ограничен ЦП. Есть ли какой-либо алгоритм хеширования, способный...
Я сделал ошибку, указав поле как целое, а не как плавающее. Я обнаружил, что не могу внести исправления в поле после создания таблицы. Мне нужно удалить и заново создать...
- переехал сюда из ТАК (здесь нет комментариев) Вопрос: каков правильный способ освобождения места в большой (сотни ГБ) файловой группе с одним разделом таблицы, который...
Мы используем базу данных cassandra для информации о веб-сайтах магазина, но не знаем, как сохранять изображения. Мы можем хранить их в кассандре, но мы также можем выделить...
У меня есть вопрос об инфраструктуре Apache Spark, который я собираюсь развернуть в новом проекте с (максимум) примерно 4 ТБ данных, используемых для моделирования в любой...
Я слышал, что рекомендуется держаться подальше от хостинга AWS для определенных приложений "больших данных" (например, Hadoop, Cassandra, Solr), потому что экземпляры EC2...
мы пытаемся проверить наши Кассандра целостность данных кластера с: nodetool repair...
У нас есть много ТБ данных на внешних дисках (паспорта WD), и мы хотим обрабатывать их с помощью виртуальных машин Azure. Загрузка займет вечность (и пропускная способность...
Я пытаюсь добавить узлы в кластер Cloudera. Когда агент запускается, я получаю python stacktrace, в котором говорится, что он не может работать с master-host: 7182, однако я...
мы хотим найти значения для следующих параметров искры в соответствии с входными данными, такими как память на машине узла данных, ЯДРО ЦП на машине узла данных, номера машины...