Перейти на главную страницу

hadoop – список вопросов по тегу – страница №5

Я пытаюсь создать улей. Я использую это руководство: https://cwiki.apache.org/Hive/gettingstarted.html и я застрял при настройке каталогов / tmp и / user / hive / inventory...
Я пытаюсь протестировать некоторые службы, требующие HDFS, используя Docker Compose. Поскольку тестируемые службы, namenode и узел (ы) данных будут работать на одном физическом...
Мы развернем кластер hadoop на сотнях (скажем, 300) физических узлов x86. Поскольку у нас нет большого опыта развертывания в производственной среде, есть простой вопрос по...
Я пытаюсь создать группу на одном из моих узлов данных, которая будет иметь привилегии суперпользователя для hdfs и связанных команд fs. Пока у меня есть: Проверено, что...
Наш кластер HDFS заполнен только на 90%, но на некоторых узлах данных есть диски, заполненные на 100%. Это означает, что когда мы массово перезагружаем весь кластер, некоторые...
В настоящее время URL-адреса, сгенерированные программой jobtracker и namenode, возвращают либо имена хостов, такие как bubble.local, либо просто пузырьки. Они не разрешаются...
Есть ли умный способ удалить старые файлы из каталога hdfs / tmp? (На всякий случай я не говорю о unix FS / tmp)
Это своего рода ответ на вопрос без ответа, касающийся администрирование кластера Cloudera, но я полагаю, что обобщение вопроса на всю Ubuntu может помочь мне получить ответ. Я...
В настоящее время я отвечаю за быстрорастущий кластер Hadoop для своего работодателя, который в настоящее время построен на выпуске 0.21.0 с CentOS в качестве ОС для каждого...
У нас есть довольно большие наборы данных (пользовательские события и информация журнала сервера -> 100 ГБ), которые становятся довольно громоздкими для обработки данных. Я...