Назад | Перейти на главную страницу

Сетевой плагин collectds отправляет данные только каждые 100 секунд

Я бился головой об стену последние пару часов, поэтому решил спросить вас, ребята.

У меня есть один экземпляр collectd, который настроен на получение показателей statsd и использование network плагин, чтобы направить их вперед к основному экземпляру collectd, который затем отправит их на infxdb через write_graphite плагин.

Отправка показателей в statsd плагин работает (я проверял tcpdump и использовал csv плагин в качестве инструмента отладки).

Это становится проблемой, когда дело доходит до network плагин для отправки собранных метрик в "основной" экземпляр collectd. В network плагин, кажется, отправляет данные только раз в 100 секунд или при перезапуске (я думаю, он очищает буферы, когда останавливается).

Вот конфиги клиентской машины:

/etc/collectd/collectd.conf

Hostname "collectd.client"
FQDNLookup false
BaseDir "/var/lib/collectd"
PluginDir "/usr/lib/collectd"
TypesDB "/usr/share/collectd/types.db"
AutoLoadPlugin false
Interval 10

LoadPlugin logfile

<Plugin logfile>
   LogLevel "info"
   File "/var/log/collectd.log"
   Timestamp true
   PrintSeverity true
</Plugin>

<Include "/etc/collectd/conf.d">
    Filter "*.conf"
</Include>

/etc/collectd/conf.d/network.conf

LoadPlugin network

<Plugin "network">
        <Server "main-instance-ip" "25826">
            SecurityLevel "Encrypt"
            Username "collectd"
            Password "xxxxxxxx"
    </Server>
</Plugin>

/etc/collectd/conf.d/collectd.statsd.conf

LoadPlugin statsd

<Plugin statsd>
    Host "0.0.0.0"
    Port "8125"
</Plugin>

Вот результат tcpdump работает немного:

$ sudo tcpdump -i any udp port 25826
tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on any, link-type LINUX_SLL (Linux cooked), capture size 65535 bytes
04:49:52.889504 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1337
04:51:52.889498 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1373
04:53:52.889469 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1363
04:55:42.889507 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1375
04:57:42.889504 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1368
04:59:52.889519 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1366
05:01:52.889511 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1363
05:03:42.889507 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1375
05:05:42.889485 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1363
05:07:32.889497 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1375
05:09:32.889477 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1363
05:11:22.889528 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1375
05:13:32.889503 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1395
05:15:42.889484 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1366
05:17:42.889493 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1373
05:19:42.889552 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1368
05:21:52.889502 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1361
05:23:42.889500 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1375
05:25:42.889491 IP ip-10-xxx-xx7-60.ec2.internal.43536 > ip-10-xxx-xx-7.ec2.internal.25826: UDP, length 1363

Судя по выходным данным, вместо этого он решил запускать каждые ~ 2 минуты.

Сколько ценностей вы собираете?

Насколько я знаю, network плагин отправляет данные, когда его буфер заполнен. Попробуй использовать MaxPacketSize 1024 директиве или собрать больше данных.