Назад | Перейти на главную страницу

Какие инструменты доступны для сбора и составления отчетов о метриках системы (приложения, базы данных и системы)?

Я собираюсь настроить инструмент для сбора данных об использовании и KPI из нескольких систем на разных платформах. Мы хотели бы регулярно сообщать о ключевых показателях использования и работоспособности системы. Это не обязательно должен быть мониторинг в реальном времени, только ежемесячные показатели производительности и использования.

Системы, которые будут использоваться, будут варьироваться от ящиков Solaris с большим приложением ERP до IIS, на котором работает наша интрасеть. Мы договоримся о 2-5 kpi для каждой, а затем напишем какой-нибудь скрипт для извлечения данных из каждой системы. Данные будут варьироваться от использования по имени пользователя, использования по приложению до данных о производительности, таких как время ответа от каждого сайта.

Есть ли какие-нибудь готовые приложения для хранения различных показателей и создания отчетов?

В моем случае это должно быть от бесплатного до дешевого, иначе мы просто создадим и будем поддерживать небольшую БД сами.

Взгляните на Polymon. http://polymon.codeplex.org

Судя по тому, что вы описываете, это именно то, что вам нужно.

И бесплатно.

«Есть ли какие-нибудь готовые приложения для хранения различных показателей и создания отчетов?»

Ваша операционная система? :)

Состоят ли данные метрик из простых чисел, семантика которых понятна вашим скриптам? SNMP может извлекать различные данные из кроссплатформенных систем, но вы должны указать вызовы exec для чего-либо, кроме обычного MIB.

Как вы говорите, я думаю, что индивидуальный подход - это тот, который лучше всего подойдет вам, всего несколько скриптов и база данных.

Существует ряд различных коммерческих инструментов для мониторинга, например, HP OpenView Operations, в частности, монитор производительности, который вам подходит, но все они очень дороги. Я думаю, вам следует начинать с того, что говорить не о том, чего вы хотите, а о том, чего вы надеетесь достичь: «Мы хотели бы регулярно сообщать о ключевых показателях использования и работоспособности системы». Вы изучаете состояние оборудования серверов в вашей среде? Здесь подойдет HP SIM или другой инструмент на основе SNMP. Вы ищете важную статистику системы, такую ​​как использование ЦП, место на жестком диске, использование сети? Для linux вам нужен sar, collectd. Для Windows вы можете получить эту статистику, я думаю, разговаривая по SNMP.

В зависимости от вашей среды может быть более целесообразным сосредоточиться на мониторинге производительности и работоспособности приложений, а не на базовой ОС. ЦП, скачки нагрузки в сети - это грубые меры, и в сложной среде это не обязательно то, что вас волнует. Сначала измеряйте количество транзакций в секунду, чтобы знать, есть ли у вас проблема, которую нужно исследовать.

Было бы уместно взглянуть на инструменты мониторинга журналов, такие как splunk, поскольку ваши системы часто сообщают вам, если что-то не так. Опять же, это зависит от того, чего вы действительно пытаетесь достичь.

OVO, вероятно, будет тем инструментом, который сделает то, что вы хотите, но это дорого. Для инструментов с открытым исходным кодом посмотрите cacti, nagios и collectd.