Я провел много исследований по мониторингу показателей SLI с помощью Prometheus. Я нашел только, как отслеживать кластер с помощью Kubernetes. Я надеюсь найти здесь ответ на простой мониторинг.
Я также хочу знать, что лучше для этого, используя метод R.E.D (скорость, ошибка, продолжительность) или метод USE (использование, насыщение, ошибки)?
Если возможно, приведите несколько примеров (например: 1-clamp_max(sum(rate(wmi_cpu_interrupts_total[2m])),1)
) Для 4 самых стандартных метрик: ЦП / ДИСКИ / Сеть / Память.