Я пробовал все мыслимые комбинации в попытке кластеризовать rabbitmq в среде AWS. Но резюмируем:
Несоответствие имени хоста - единственная загадка. Сам узел считает, что его имя хоста - «q1» или «q2» соответственно. Когда я пытаюсь установить имя хоста контейнера на частное имя DNS хоста (чтобы он мог подключиться к другому узлу), экземпляр кролика в контейнере аварийно завершает работу. Не ниже того, как hostname
производит q2
а я обстрелял частный днс амазонки?
root@q2:~# hostname
q2
root@q2:~# exit
christian@q2:~$ logout
Connection to ip-10-0-3-101.us-west-2.compute.internal closed.
Я использую последний образ докера rabbitmq.
docker run -d --restart always --hostname q1 --name rabbitmq -p 4369:4369 -p 15671:15671 -p 25672:25672 -p 15672:15672 -p 5672:5672 -e RABBITMQ_HIPE_COMPILE=1 -e RABBITMQ_ERLANG_COOKIE='ilikecookies' rabbitmq:3-management
Служба запускается нормально
root@q1:~# curl -I localhost:15672
HTTP/1.1 200 OK
Content-Length: 1419
Content-Type: text/html
Date: Fri, 20 Jan 2017 22:46:12 GMT
last-modified: Fri, 20 Jan 2017 22:38:45 GMT
Server: MochiWeb/1.0 (Any of you quaids got a smint?)
А вот и cookie от хоста q1
root@q1:~# docker exec -it rabbitmq /bin/bash
root@q1:/# cat /var/lib/rabbitmq/.erlang.cookie
ilikecookies
root@q1:/#
Теперь я пытаюсь сгруппировать его (с хоста q2, где q1 является главным)
root@q2:~# docker exec -it rabbitmq /bin/bash
root@q2:/# rabbitmqctl stop_app
Stopping node rabbit@q2 ...
root@q2:/# rabbitmqctl join_cluster rabbit@ip-10-0-3-56.us-west-2.compute.internal
Clustering node rabbit@q2 with 'rabbit@ip-10-0-3-56.us-west-2.compute.internal' ...
Error: unable to connect to nodes ['rabbit@ip-10-0-3-56.us-west-2.compute.internal']: nodedown
DIAGNOSTICS
===========
attempted to contact: ['rabbit@ip-10-0-3-56.us-west-2.compute.internal']
rabbit@ip-10-0-3-56.us-west-2.compute.internal:
* connected to epmd (port 4369) on ip-10-0-3-56.us-west-2.compute.internal
* epmd reports node 'rabbit' running on port 25672
* TCP connection succeeded but Erlang distribution failed
* suggestion: hostname mismatch?
* suggestion: is the cookie set correctly?
* suggestion: is the Erlang distribution using TLS?
current node details:
- node name: 'rabbitmq-cli-41@q2'
- home dir: /var/lib/rabbitmq
- cookie hash: quN0y0GUm2Zxv8VYc2eX9A==
root@q2:/# cat /var/lib/rabbitmq/.erlang.cookie
ilikecookies
root@q2:/#
Вопрос КАК вы собираете эти вещи в кластеры? Какой ингредиент отсутствует? Сообщение об ошибке ничего не значит в Интернете. У кого-нибудь есть в этом опыт?
ОБНОВИТЬ Группа безопасности AWS для этих экземпляров:
Custom TCP Rule
TCP
1024 - 65535
0.0.0.0/0
Ладно, я понял!
имена хостов каждого узла должны совпадать внутри контейнера.
На хост-машине (q2) я проверил, какие хосты ему известны в файле hosts:
# This file was generated by OpsWorks
# any manual changes will be removed on the next update.
# The following lines are desirable for IPv6 capable hosts
::1 ip6-localhost ip6-loopback
fe00::0 ip6-localnet
ff00::0 ip6-mcastprefix
ff02::1 ip6-allnodes
ff02::2 ip6-allrouters
ff02::3 ip6-allhosts
# OpsWorks Layer State
127.0.0.1 localhost.localdomain localhost
127.0.1.1 q2.localdomain q2
10.0.3.56 q1.localdomain q1
10.0.3.101 q2.localdomain q2
root@q2:/# ping q1
PING q1.local (10.0.3.56): 56 data bytes
^C--- q1.local ping statistics ---
2 packets transmitted, 0 packets received, 100% packet loss
Затем мне пришло в голову, что совсем не важно, что знает хост-машина, это то, о чем знает контейнер докеров. Итак, я залез в контейнер и проделал то же самое:
root@q2:/# cat /etc/hosts
127.0.0.1 localhost
::1 localhost ip6-localhost ip6-loopback
fe00::0 ip6-localnet
ff00::0 ip6-mcastprefix
ff02::1 ip6-allnodes
ff02::2 ip6-allrouters
172.17.0.2 q2.local
Теперь мы кое-что знаем! Итак, я добавил запись для мастера узла:
root@q2:/# echo "10.0.3.56 q1.local q1" >> /etc/hosts
root@q2:/# which ping
/bin/ping
root@q2:/# ping q1
PING q1.local (10.0.3.56): 56 data bytes
И сделал еще один поворот внутри контейнера
root@q2:/# rabbitmqctl stop_app
Stopping node rabbit@q2 ...
root@q2:/# rabbitmqctl join_cluster rabbit@q1
Clustering node rabbit@q2 with rabbit@q1 ...
root@q2:/#
И теперь каждый узел распознает, что он сгруппирован! Woot!
Я думаю, что для кластеризации с докером я собираюсь изменить команду докера для монтирования хостов /etc/hosts
файл в образ докера с помощью -v /etc/hosts:/etc/hosts:ro
и тогда это должно работать волшебным образом
Еще один шаг, о котором я забыл упомянуть: в локальной системе Ubuntu была запущена старая версия erlang, которую мне пришлось удалить (и в ней также был кролик).