У меня один узел (псевдораспределенная конфигурация), и я рассматриваю возможность добавления второго подчиненного узла. Имеет ли значение, если у ведомого меньше емкости HD? Перебалансирует ли это на себя? Я далеко не эксперт по HADOOP.
Нет, это не имеет значения, но HDFS не будет автоматически перераспределять блоки на новый узел, поэтому вам придется делать это на своей стороне. Самый простой способ - запустить bin/start-balancer.sh
. Кроме того, перед выполнением какой-либо перебалансировки убедитесь, что вы соответствующим образом изменили файлы conf, чтобы приспособиться к переходу от псевдораспределенной конфигурации к кластерной.
Проверьте этот вопрос в FAQ по Hadoop, чтобы узнать о других способах перебалансировки.
Hadoop сбалансирует нагрузку. Кроме того, вы можете установить свойство «dfs.replication», чтобы установить необходимое количество репликаций.