Назад | Перейти на главную страницу

Сбой Ganglia gmetad после некоторой работы (на AWS EC2)

Мы используем Ganglia для мониторинга нашей облачной инфраструктуры на Amazon AWS. Все работает правильно (метрики текут и т. Д.), За исключением того, что иногда процесс gmetad внезапно дает сбой. Процесс gmetad выполняется на m3.medium EC2 и контролирует около 50 серверов. Серверы организованы в группы, у каждого из которых есть бастион EC2, где собираются показатели. gmetad настроен на получение показателей с этих бастионов - около 10 из них.

Несколько полезных фактов:

Кто-нибудь испытывал такой сбой, особенно на оборудовании Amazon? Мы находимся в упадке, пытаясь найти решение!