Назад | Перейти на главную страницу

Мониторинг SLA / SLO / SLI с помощью Prometheus

Я провел много исследований по мониторингу показателей SLI с помощью Prometheus. Я нашел только, как отслеживать кластер с помощью Kubernetes. Я надеюсь найти здесь ответ на простой мониторинг.

Я также хочу знать, что лучше для этого, используя метод R.E.D (скорость, ошибка, продолжительность) или метод USE (использование, насыщение, ошибки)?

Если возможно, приведите несколько примеров (например: 1-clamp_max(sum(rate(wmi_cpu_interrupts_total[2m])),1)) Для 4 самых стандартных метрик: ЦП / ДИСКИ / Сеть / Память.