Мы используем прокси-сервер высокой доступности в инстансе Amazon EC2 для маршрутизации определенных запросов к двум различным внутренним балансировщикам нагрузки, которые являются EC2 ELB (эластичные балансировщики нагрузки).
Вот конфигурация прокси HA:
defaults
mode http
log global
no option redispatch
retries 25
timeout connect 10000 # default 10 second time out if a backend is not found
timeout client 30000
timeout server 30000
maxconn 20000
stats uri /haproxy?stats
option http-server-close
timeout http-request 100s
timeout http-keep-alive 124s
backend main-service-backend
option httpchk GET /ping
server main-service internal-main-service:80 check inter 5s fall 10
backend micro-service-backend
option httpchk GET /ping
server micro-service internal-micro-service:80 check inter 5s fall 10
frontend shared-frontend *:80
acl is-micro-service-url path_reg ^/(/rest/user/.*/?)
use_backend micro-service-backend if is-micro-service-url
default_backend main-service-backend
Обычно, если я выключаю один из серверов на время, прокси HA восстанавливается. Однако, похоже, произошла какая-то ошибка сети / маршрутизации, и прокси-сервер HA не восстанавливается.
Вот журналы прокси HA:
Server micro-service-backend/micro-service is DOWN, reason: Layer4 connection problem, info: "No route to host", check duration: 998ms. 0 active and 0 backup servers left. 1 sessions active, 0 requeued, 0 remaining in queue.
backend micro-service-backend has no server available!
HA-прокси перестает проверять сервер и продолжает отмечать его как DOWN. Однако я могу успешно выполнить проверку работоспособности http из прокси-сервера HA во внутренний балансировщик нагрузки:
curl -i http://internal-micro-service:80/ping
HTTP/1.1 200 OK
Content-Type: text/plain;charset=UTF-8
Date: Fri, 12 Jun 2015 23:08:29 GMT
Server: Apache-Coyote/1.1
Content-Length: 2
Connection: keep-alive
UP
Есть идеи, что может быть не так? Что еще я должен исследовать?
После некоторого поиска в Google я обнаружил, что прокси HA разрешает DNS только при запуске. ELB EC2 могут случайным образом изменять IP-адреса, что приводит к сбою проверки работоспособности, поскольку прокси-сервер высокой доступности не выполняет разрешение DNS до того, как он выполнит проверку работоспособности.
Эластичные балансировщики нагрузки меняют IP-адреса