Я хотел бы отслеживать задержку обработки запросов на моем сервере Tomcat. Было бы неплохо сделать несколько предупреждений на основе этого позже. Я настроил клапан Tomcat с шаблоном% D, чтобы он регистрировал время, затрачиваемое на обработку каждого запроса, в файл журнала доступа. Каким будет правильный способ вычисления 50, 90, 99 процентилей по этим логическим линиям? Я уже настроил Prometheus и Grafana для основных метрик хоста (cpu / mem, hdd), но мне непонятно, как правильно рассчитать процентили и построить их график с помощью prometheus / grafana? Идея состоит в том, чтобы обнаружить сбой в приложении и отреагировать, прежде чем оно полностью перестанет отвечать. Спасибо всем заранее!
Вы могли бы использовать мой tomcat_exporter для этого нужно настроить фильтр для показателей времени отклика. В качестве альтернативы вы можете реализовать аналогичный фильтр самостоятельно.