Назад | Перейти на главную страницу

Мониторинг и отчетность о сбоях страниц для определения проблем с памятью

Я нахожусь в процессе настройки монитора (ов) производительности для всех серверов в моем домене. Я использую WhatsUp Gold 16.2, чтобы отправлять оповещения при достижении определенных пороговых значений. Недавно я прочитал статью Microsoft, в которой говорилось, что скорость до 150 страниц в секунду является приемлемым порогом. Проблема с WUG в том, что наименьшая единица измерения, которую я могу измерить, - это одна минута. Я думал о том, чтобы умножить 150 * 60 и отправить предупреждение о 9000 плюс, но это не похоже на то, что это хороший показатель давления памяти

Один из моих системных администраторов создал монитор для отправки предупреждений, если за 30 минут у нас будет более 4000 ошибок страниц. Я не думаю, что это лучше, чем предложенный мной выше монитор.

Пример монитора ошибок на 4000 страниц:

Физический, а не виртуальный сервер 2003 R2 с пакетом обновления 2 (SP2) Функционирует как контроллер домена в удаленном офисе 32-разрядная версия 4 ГБ ОЗУ 4 ГБ файл подкачки 2 процесса 2,8 ГГц

RAM 30-дневный график: Среднее значение: 18,5% Макс: 26,6%

График виртуальной памяти за 30 дней: Среднее значение: 5,38% Макс: 6,66%

Вышеупомянутая система выдает предупреждение с более чем 4400 ошибками страниц за 30 минут. По статистике очевидно, что нет необходимости говорить о нехватке памяти, и при этом монитор ошибок на 4000 страниц не является хорошим индикатором проблемы.

Большая часть моей среды виртуальная (VMWare и Hyper-V), в основном VMWare. Почти все серверы являются разновидностью Server 2008, очень немногие серверы 2003 года и несколько серверов 2012 года. Очень немногие из них являются физическими.

Мой вопрос действительно сводится к следующему:

Что я должен отслеживать и какой порог срабатывания предупреждения с частотой дискретизации до одной минуты?