У меня есть привязка 9.9.5, работающая на двух серверах (CentOS 6 и 7), для кеширования и пересылки DNS-запросов для почтового сервера. Серверы работают нормально в течение нескольких недель, а затем внезапно отвечают на все запросы с помощью SERVFAIL. В первый раз оба сервера вышли из строя в один и тот же день. Теперь, через неделю, это случилось снова, но только на одном сервере. Перезапуск named
устраняет проблему.
Вот важные моменты /etc/named.conf
(полный файл с нерелевантными битами Вот):
acl "trusted" {
localhost;
localnets;
10.128.0.0/9;
};
options {
listen-on port 53 { 127.0.0.1; 10.128.0.0/9; };
listen-on-v6 port 53 { ::1; };
directory "/var/named";
dump-file "/var/named/data/cache_dump.db";
statistics-file "/var/named/data/named_stats.txt";
memstatistics-file "/var/named/data/named_mem_stats.txt";
bindkeys-file "/etc/named.iscdlv.key";
managed-keys-directory "/var/named/dynamic";
auth-nxdomain no;
version "asdf";
dnssec-enable yes;
dnssec-validation yes;
dnssec-lookaside auto;
recursion yes;
forward only;
forwarders { 169.254.169.254; };
allow-query { trusted; };
allow-recursion { trusted; };
};
Когда сервер находится в состоянии сбоя, ответ на запрос поиска:
[q@oak3] dig @10.128.0.9 apple.com a
; <<>> DiG 9.8.2rc1-RedHat-9.8.2-0.68.rc1.el6_10.1 <<>> @10.128.0.9 apple.com a
; (1 server found)
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: SERVFAIL, id: 44811
;; flags: qr rd ra; QUERY: 1, ANSWER: 0, AUTHORITY: 0, ADDITIONAL: 0
;; QUESTION SECTION:
;apple.com. IN A
;; Query time: 3 msec
;; SERVER: 10.128.0.9#53(10.128.0.9)
;; WHEN: Fri Mar 15 19:22:06 2019
;; MSG SIZE rcvd: 27
Появятся следующие записи журнала:
==> /var/named/chroot/var/log/queries.log <==
15-Mar-2019 19:22:06.983 client 10.128.0.4#55092 (apple.com): query: apple.com IN A + (10.128.0.9)
==> /var/named/chroot/var/log/dnssec.log <==
15-Mar-2019 19:22:06.984 validating apple.com/A: bad cache hit (com/DS)
==> /var/named/chroot/var/log/lame-servers.log <==
15-Mar-2019 19:22:06.984 broken trust chain resolving 'apple.com/A/IN': 169.254.169.254#53
После перезапуска named
, выполняя тот же запрос (dig @10.128.0.9 apple.com a
) отвечает правильно, и в журнале ошибок нет.
На момент начала сбоя запросов в журнале ничего важного не было. /var/logs
. В последнее время сервер не перезагружался, обновления в последнее время не устанавливались.
Есть ли проблема с моей конфигурацией? Что может привести к внезапному отказу нормально работающего сервера привязки?