Назад | Перейти на главную страницу

Hadoop - имя узла и узла данных на одном компьютере

У нас есть 7 идентичных физических серверов (2x8 ядерных процессора, 128 ГБ ОЗУ, 8 дисков по 6 ТБ), которые будут использоваться для Hadoop. Все машины подключены к коммутатору 10G с двойными интерфейсами 10G. Поскольку у нас не так много машин, мы хотим использовать одну из машин и как узел имени, и как узел данных. Эта конфигурация вызовет проблемы с производительностью? Система Hadoop будет использоваться в академических целях, поэтому будет ли узел данных на узле имени иметь такую ​​же производительность, как и другие узлы данных? Если это не лучшее решение, каковы минимальные требования к узлу имени для этой конфигурации?

Не рекомендуется использовать NN и DN на одной машине, так как DN может заполниться, и у вашего NN могут возникнуть проблемы и, в свою очередь, вывести из строя весь кластер!

Если вы уверены, что в вашем DN всегда будет достаточно места, вы можете это сделать (не рекомендуется).