Перейти на главную страницу

big-data – список вопросов по тегу – страница №2

Presto не может обрабатывать много одновременных сеансов. какое максимальное количество одновременных сеансов на presto и как установить для этого параметр? и как справиться с...
Кажется, есть проблема с обслуживанием больших файлов размером 10+ ГБ с запросами байтового диапазона на нашем 64-разрядном сервере RHEL5. Проблема, которую я замечаю...
У меня есть несколько проблем, связанных с HDFS, которые могут иметь разные корни. Я публикую как можно больше информации в надежде, что смогу узнать ваше мнение хотя бы по...
В настоящее время я работаю на AWS по цене от 25 до 40 тысяч долларов в месяц. У меня около 30 ТБ данных, проиндексированных в Elasticsearch, запущен производственный кластер с...
Я использую mhddfs для объединения нескольких дисков, подключенных по сети с помощью NFS. например Есть три машины Server Name Dir Space...
Сервер ZooKeeper создает файлы моментальных снимков и файлы журнала, но никогда не удаляет их. Поэтому нам нужно позаботиться о политике хранения. Как определить правильное...
Я использую Google Cloud Compute Engine и Google Cloud Storage. Я хочу загрузить огромное количество данных с помощью своего экземпляра, поэтому я установил свою корзину в...
у нас есть версия Hadoop - 2.6.4 На машине datanode мы видим, что данные hdfs не сбалансированы На некоторых дисках используется другой размер sdb. 11G и SDD 17G /dev/sdd 20G...
Мы хотим предложить следующее, исходя из наших проблем с дисками kafka У нас много кластеров HDP (на основе ambari, и все машины - redhat версии 7.2) Каждый кластер включает 3...
у нас есть кластер амбари (версия 2.6) с 3 рабочими машинами, и каждая рабочая машина имеет 16 ЯДРА ЦП (см. рис. ниже), в то время как каждая машина имеет 32 ГБ памяти в...