Назад | Перейти на главную страницу

Ganglia не обновляет график

Я начал замечать, что мой веб-интерфейс не обновлял график в течение нескольких часов. Каждый раз, когда я перезапускаю gmond на моих клиентах, я вижу, что графики работают. Я возвращаюсь примерно через час, и мой график пустой, просто белый график, и ничего не обновлялось. если я запустил его снова, он работает нормально. Я не уверен, что это такое.

Моя установка выглядит следующим образом.

Клиент -> сборщик gmond -> gmeta / веб-хост

gmetad.conf

data_source "ENG1" 10.199.1.110
data_source "ENG2" 10.199.19.100
data_source "QA" 10.199.10.200

gmond.conf от 10.199.10.2002

globals {
    daemonize = yes
    setuid = yes
    user = nobody
    debug_level = 0
    max_udp_msg_len = 1472
    mute = no
    deaf = no
    allow_extra_data = yes
    host_dmax = 0 /*secs */
    cleanup_threshold = 300 /*secs */
    gexec = no
    send_metadata_interval = 0 /*secs */
}

cluster {
    name = "QA"    
}

udp_send_channel {
    host = 10.199.10.200
    port = 8649
    ttl = 1
}

udp_recv_channel {
    port = 8649
}

** gmond.conf нет, мои клиентские файлы такие же, как указано выше, за исключением того, что у него нет udp_recv_channel блок определен. Я перенаправил состояния от моего клиента на сборщик (например, 10.199.10.200), который затем был извлечен сервером gmeta (10.199.1.110). Этот сервер также собирает данные с группы серверов, определенной как «ENG1».

Я столкнулся с этой проблемой, когда Ganglia установлен на Ubuntu. Согласно документ, похоже, что gmond потерял метаданные и не знает, что делать с данными метрики. Поскольку вы настраиваете Ganglia в одноадресном режиме, вам необходимо указать gmond периодически отправлять метаданные, изменяя send_metadata_interval к ненулевому значению:

globals {
  daemonize = yes
  setuid = yes
  user = ganglia
  debug_level = 0
  max_udp_msg_len = 1472
  mute = no
  deaf = no
  allow_extra_data = yes
  host_dmax = 0 /*secs */
  cleanup_threshold = 300 /*secs */
  gexec = no
  send_metadata_interval = 30 /*secs */
}

Попробуйте!

Читать далее:

http://sourceforge.net/apps/trac/ganglia/wiki/ganglia_release_notes

Сборщики 3.1 запросят у gmond повторную отправку информации о его метрике, если это необходимо, а при использовании многоадресной рассылки, если вы используете одноадресную рассылку, пока нет возможности сделать это, и поэтому, если вы перезапустите ваш сборщик, останутся частичные или никакие данные из кластера которые собираются через него, пока не будут перезапущены все gmond в этом кластере. Чтобы обойти эту проблему при использовании настройки одноадресной рассылки send_metadata_interval до разумного значения, чтобы все gmond периодически пересылали свои метаданные сборщику на случай, если он потеряется.

http://sourceforge.net/apps/trac/ganglia/wiki/FAQ

В последних версиях gmond (3.1.x) была добавлена ​​новая глобальная переменная в gmond.conf называется send_metadata_interval, со значением по умолчанию 0. Целью было уменьшить сетевой трафик. В 3.1 метрические данные отправляются отдельно от метаданных, например. метаданные содержат подробное описание, группировку, другие возможные настройки. Нулевое значение означает, что gmond будет отправлять метаданные при запуске, а не в другое время (что согласуется со старыми версиями ганглиев).

Если вы планируете использовать одноадресный режим, установите send_metadata_interval к чему-то другому, кроме 0. 30-60 секунд, как было установлено, в большинстве случаев надежно работают. Установка этой переменной в ненулевое значение заставит процессы gmond периодически объявлять свои метрики, и графики снова появляются на странице просмотра хоста.

Попробуйте добавить: tcp_accept_channel { port = 8649 }

Я изменил конфигурацию, чтобы использовать многоадресную передачу, и теперь она работает!