Назад | Перейти на главную страницу

Знаете об инструменте мониторинга инфраструктуры, который определяет, а затем измеряет / предупреждает отклонения?

Я ищу инструмент для мониторинга ресурсов инфраструктуры, и после дня безуспешных поисков в Google я надеюсь, что кто-нибудь поможет мне найти его. Я прочитал об этом около 6 месяцев назад («кажется», что нашел это через hackernews), и теперь я не могу найти ссылку на него.

По сути, этот инструмент мониторинга просто определяет все, изучая шаблоны использования вашей инфраструктуры, а затем предупреждает вас об изменениях в этих шаблонах. Со временем то, что когда-то было переменной, переучивается как образец, по мере того как система продолжает изучать.

Компания Riverbed имеет нечто подобное в своем продукте Cascade, но они смотрят только на сетевой трафик. У кого-то есть это для мониторинга ресурсов сервера, но я их не нахожу.

Кто-нибудь еще помнит, как недавно читал об этом новом продукте?

monitoring

После многих лет внедрения системы мониторинга с использованием Nagios я сомневаюсь в пригодности такого инструмента, за исключением узкого набора услуг.

Характеристики использования большинства используемых нами систем резко меняются в течение обычного дня / недели. Некоторые системы очень загружены в понедельник, другие в среду и т. Д. Некоторые из них заняты днем, другие - ночью и т. Д.

Я могу представить себе такую систему, которая правильно работает для 25% систем или, возможно, получает определенные параметры (например, диск или память) большую часть времени, другие параметры, такие как загрузка ЦП или сети, кажутся, на мой взгляд, реальными проблемами.

Существует алгоритм, называемый Алгоритм прогнозирования временных рядов Холта-Винтерса; его можно использовать для анализа данных временных рядов и обнаружения аномалий, даже если данные временных рядов имеют периодические колебания (например, дневные пики). rrdtool реализует это как RRA «HWPREDICT», которое собирает дополнительные данные во время мониторинга для реализации этого алгоритма и определения пороговых значений.

Можно использовать анализ Холта-Винтерса для динамического определения пороговых значений на основе реальных тенденций данных (в отличие от априорной конфигурации). $ work имеет полностью настраиваемую систему, в которой мы можем добавлять данные HWPREDICT в определенные RRA, а затем генерировать предупреждения при превышении пороговых значений. Он работает хорошо, но, как я уже сказал, полностью кастомный. Я хотел бы знать, есть ли какой-нибудь продукт, который может сделать это за нас.