В настоящее время я администрирую веб-сайт, размещенный на Google Cloud Platform, с использованием Kubernetes Engine. Вчера я заметил, что поток CPU% на узле GKE резко упал до значения чуть севернее 0. После исследования стало ясно, что все в порядке - сайт все еще работает, и проверка использования процессора напрямую через SSH показала нормальные уровни нагрузки. Похоже, что управляемый Google агент мониторинга в GKE не может точно сообщить об использовании ЦП, хотя все остальные значения сообщаются правильно.
Кто-нибудь сталкивался с этой проблемой? Есть ли решение для восстановления точных значений мониторинга в этом случае?
--зиг
РЕДАКТИРОВАТЬ: Чтобы прояснить мой исходный пост, этот канал точно отражал использование нашего живого экземпляра в течение многих лет до внезапного и неточного отчета 0%. Лента также остается точной для наших сред разработки и тестирования.
Использование ЦП на главной панели мониторинга GCP отличается от использования ЦП отдельным экземпляром. Использование ЦП, отображаемое в консоли разработчика Google, - это не использование экземпляра, а использование ЦП контейнера, управляющего экземпляром. Этот контейнер отвечает за предоставление услуг виртуализации экземпляру и сбор всех метрик, используемых для балансировки нагрузки, автоматического масштабирования, облачного мониторинга и т. Д. Таким образом, большое количество операций ввода-вывода или сетевых операций приведет к показанной загрузке ЦП. в Google Developers Console на пик.
В качестве обходного пути вы можете использовать Stackdriver Monitoring. специальные показатели чтобы получить более точные показатели использования ЦП.