Настройка нескольких кластеров Hadoop

Надеюсь, этот вопрос не не по теме. Я спросил об этом на AskUbuntu, но не получил ответа:

Я следил за отличным руководством Майкла Нолла по настройке Hadoop в одном кластере: http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/

Теперь я хотел бы настроить второй узел для некоторой обработки. В этом руководстве и во всех других, которые я видел, все эти кластеры находятся в одной локальной сети. Однако я выполняю свой проект с использованием виртуальной машины, предоставленной мне моим университетом, к которой я получаю доступ с помощью PuTTY, подключаясь к ее IP-адресу. Могу ли я подключить этот компьютер через Hadoop к другому компьютеру с совершенно другим IP-адресом? Это вообще возможно? Я попытался отредактировать / etc / hosts обоих компьютеров и сохранить IP-адрес следующим образом:

117.118.45.205:127.0.0.1 локальный хост

Сначала с реальным IP-адресом, а затем с «локальным» IP-адресом, но это не сработало. Есть ли у кого-нибудь предложения, или это просто невозможно?

ubuntu-12.04 hadoop

Во-первых, ваше редактирование /etc/hosts неправильно. Добавьте общедоступный IP-адрес во второй строке, не используйте двоеточие для разделения таких IP-адресов. Этот синтаксис не будет понят.

Во-вторых, (я считаю), если второй компьютер может пинговать первый, и наоборот, его можно настроить как узел в кластере Hadoop. Если нет, то нет. Могут возникнуть проблемы, связанные с переходом границы маршрутизации (если вы это сделаете), но у меня нет достаточного опыта, чтобы быть уверенным в этом.