Мне было интересно, можно ли настроить Performance Co-Pilot (PCP) таким образом, чтобы он имел все функции приложения NMS, т.е. Nagios или Zabbix. Я использовал его для извлечения метрик с хоста и отображения значений на приборной панели, но я хотел бы знать, как использовать его для мониторинга нескольких сотен серверов и обнаружения сбоев. Документация PCP описывает все модули и демонов, но я не мог найти много информации о том, как их совместить. Существует механизм вывода показателей производительности (PMIE), который может оценивать логические выражения и создавать предупреждения, или PCP Manager (pmmgr), который можно использовать для сбора данных с нескольких хостов. Итак, если я хочу использовать PMIE для обнаружения сбоев и предупреждений, должен ли он работать на каждом отслеживаемом хосте или на центральном сервере NMS? Считывает ли он только показатели из журналов PCP или может подключаться к контролируемым узлам через WebAPI? Если я хочу хранить метрики в InfluxDB или ElasticSearch, нужно ли мне запускать экспортеры (pcp2influxdb или pcp2elasticsearch) на контролируемых хостах или сначала собирать журналы PCP в одном месте и экспортировать оттуда? И если pmmgr, собирающий метрики с нескольких хостов, должен иметь один экземпляр pmlogger для каждого целевого хоста, он может эффективно работать на одном сервере в больших средах, т.е. 1000 отслеживаемых серверов?
В одном посте много вопросов, но все сводится к одному: может ли PCP быть NMS или нет?