Мы развернем кластер hadoop на сотнях (скажем, 300) физических узлов x86. Поскольку у нас нет большого опыта развертывания в производственной среде, есть простой вопрос по названию, мы хотим услышать ответ от опытных парней. Какие практики лучше всего? следует ли развертывать hadoop непосредственно на физических компьютерах или нам нужен уровень виртуальной машины (например, облако IaaS) для управления вычислительными ресурсами кластера hadoop. О чем следует позаботиться при принятии этого решения?
Hadoop был разработан для работы на «голом железе».
Он намеревается управлять распределением ресурсов за вас.
Другой слой - это просто накладные расходы, которых можно избежать.
Но лучше сказать сложно, это зависит от многих факторов.
Вы должны прочитать https://cwiki.apache.org/confluence/display/HADOOP2/Virtual+Hadoop и прими свое решение.
Здесь рассматриваются причины, по которым нельзя запускать Hadoop в виртуальной среде, и объясняется, почему некоторые люди все еще могут захотеть это сделать.