Назад | Перейти на главную страницу

Ganglia - отсутствуют показатели для некоторых серверов

Недавно я установил Ganglia на свои серверы Ubuntu 16.04. Я в основном следовал инструкциям Вот.

Проблема в том, что отсутствуют rrd-файлы для наборов метрик для некоторых серверов.

Самое главное, что нет никаких показателей от самого «главного» узла, кроме показателей GPU от плагина Nvidia.

Может кто-нибудь дать мне совет по этому поводу?

Кроме того, есть ли способ заставить немедленно собирать все метрики, определенные хотя бы один раз?

Спасибо!

Я понял проблему и решение.

man gmond.conf говорит:

If you have a large system with lots of metrics, you might experience UDP drops. This happens when gmond is not able to process the UDP fast enough from the network.
In this case you might consider changing your setup into a more distributed setup using aggregator gmond hosts.  Alternatively you can choose to create a bigger
receive buffer:

  udp_recv_channel {
    port = 6343
    buffer = 10485760
  }
B<buffer> is specified in bytes, i.e.: 10485760 will allow 10MB UDP
to be buffered in memory.

Note: increasing buffer size will increase memory usage by gmond

Я увеличил максимальный размер буфера приема UDP до 100 МБ, добавив net.core.rmem_max=104857600 к /etc/sysctl.conf (для постоянного эффекта) и бег sysctl -w net.core.rmem_max=104857600 что позволило мне изменить значение без перезагрузки.

Затем я добавил buffer атрибут со значением 104857600 в udp_recv_channel заблокировать и перезапустить gmond.