Я только что настроил cacti для мониторинга использования процессора и памяти на сервере, который, как мне кажется, нуждается в обновлении, но чтобы иметь возможность обосновать свое финансирование, мне нужны неопровержимые факты.
Я полагал, что заставить Cacti отслеживать использование памяти и среднюю нагрузку можно, но создаваемый график, похоже, не коррелирует с реальностью.
Согласно top, моя средняя загрузка сейчас колеблется на отметке 5, но кактусы на графике показывают это на уровне 0,1!
Как заставить cacti отслеживать реальную среднюю нагрузку на сервер? Контролируемый сервер работает под управлением RHEL5 и в качестве демона SNMP использует net-SNMP.
Спасибо,
Барт.
cacti имеет плохой график по умолчанию, который складывает 3 значения из средней нагрузки. Общая сумма бессмысленна, и это то, на что вас обманывают. Измените график по умолчанию, чтобы использовать линии, а не стек, и вы увидите что-то лучше.
Имейте в виду, что нагрузка (например, / proc / loadavg) может быть усреднена на разных интервалах (обычно 1, 5 и 15 минут). Добавьте к этому тот факт, что повторное усреднение этих цифр по временному ряду имеет тенденцию к снижению общего показателя, и вам может быть трудно обосновать необходимость обновления.
Я предлагаю вам перестать думать о техническом решении и начать строить бизнес-обоснование на основе другого показателя, желательно такого, который коррелирует с экономическим показателем или показателем удовлетворенности клиентов - например, максимальное время отклика. Скорее всего, это позволит донести ваше сообщение до людей, которые распоряжаются деньгами.
Вы можете посмотреть на Мунин, который очень легко настроить, особенно если вы запускаете его локально. Это позволит вам быстро начать отслеживать нагрузку на ЦП и другие ресурсы без необходимости возиться с SNMP и удаленно собирать данные о ресурсах. Для RedHat есть пакеты, которые довольно просто установить.
Я хотел бы добавить к ответу @ labradort.
Я полагаю, вы говорите о ucd/net - Load Average
шаблон. Причина неправильных значений в том, что он отображает средние значения 1/5/15 отдельно, а затем складывает их вместе. Значения технически правильные, но выглядят странно. Вот как можно исправить проблему:
Перейдите в Шаблоны графиков и установите флажок справа от ucd/net - Load Average
.
Прокрутите вниз, выберите действие «Дублировать» (НЕ УДАЛИТЬ) и нажмите «Перейти».
Выберите имя для вашего нового шаблона, например ucd/net - Alternative Load Average
.
По-прежнему в разделе «Шаблоны графиков» щелкните гиперссылку нового шаблона, чтобы отредактировать его.
Щелкните "Элемент №3". Измените «Graph Item Type» с STACK на LINE1, затем нажмите «Сохранить».
Повторите это для «Элемента № 5».
Удалите «Элемент №7»: «(Нет задачи): Всего»
Окончательное редактирование должно выглядеть примерно так:
По завершении нажмите "Сохранить".
Это сделает ваше 1-минутное среднее значение полупрозрачным блоком, а более длинные средние значения будут аккуратно отставать. Окончательный результат выглядит так: