Назад | Перейти на главную страницу

HAProxy отвечает NOSRV, пока серверная часть работает

У меня странная ситуация, когда запросы к моему HAProxy возвращаются с 503. Журналы HAProxy показывают, что он возвращает ошибку NOSRV:

Mar 26 19:47:01 localhost haproxy[23910]: 10.0.0.30:34261 
  [26/Mar/2013:19:46:48.579] fe v2/<NOSRV> 12801/-1/-1/-1/12801 503 
  212 - - SC-- 0/0/0/0/0 0/0 "GET /path/v2/ HTTP/1.1"

В течение этого времени внутренний сервер был подтвержден и получал трафик от внутреннего балансировщика нагрузки. Это произошло спонтанно, без какой-либо конфигурации или других изменений в HAProxy. Это исправило перезапуск HAProxy.

Кто-нибудь знает, известна ли это проблема? Спасибо за вашу помощь / понимание.

Спасибо.

Моя конфигурация выглядит так:

global
    maxconn     1000 # Total Max Connections. This is dependent on ulimit
    daemon
    nbproc      1 # Number of processing cores. Dual Dual-core Opteron is 4 cores for example.
    log         127.0.0.1 local1
defaults
        mode        http
        clitimeout  60000
        timeout server 300000
        contimeout  4000
        option      httpclose # Disable Keepalive

backend v2
        server v2Elb internal-xxx.us-west-1.elb.amazonaws.com:80 weight 1 maxconn 512 check
backend v2e
        server v2eElb 10.0.1.28:80 weight 1 maxconn 512 check
frontend fe
        bind :80
        option httpchk
        option forwardfor # This sets X-Forwarded-For
        option httplog
        log global
        acl v2e path_beg /path/v2e
        acl v2 path_beg /path/v2
        redirect location https://my.domain.com/path/v2/ if !v2e !v2
        use_backend v2e if v2e
        use_backend v2 if v2

Я заметил из данной конфигурации, что вы работаете перед балансировщиком нагрузки AWS ELB. v2 и я предполагаю, что v2e указывает непосредственно на сервер приложений (который в противном случае находился бы за ELB)?

Если это так, это подскажет мне, что вместе с ошибкой 503 соединение между вашим экземпляром HAProxy и ELB достигает тайм-аута, либо 4-секундного contimeout тайм-аут или 300 секунд server тайм-аут. Более вероятный - 4 секунды contimeout а спорадический характер ошибки еще раз подтверждает, что это, вероятно, проблема с сетью между HAProxy и ELB.

Я бы попытался увеличить contimeout значение, а также мониторинг задержки между HAProxy и ELB.