Каково концептуально простаивающий сервер?
На какие метрики ресурсов вы бы посмотрели, чтобы сделать предположение о том, простаивает ли сервер?
Вы бы посмотрели на:
Если да, то какие пороги должны быть, чтобы решить, что что-то простаивает?
Если бы вы просто смотрели на эту статистику, перезагрузки и установка исправлений исказили бы ваши результаты.
Машина простаивает, когда она не выполняет задачу, которую должна выполнять, из-за отсутствия запросов. Например, если у вас есть почтовый сервер, вы можете определить, отправлял ли он какие-либо запросы от почтового приложения. Если это не так, и это единственное, что там есть, то он простаивает. Конечно, все усложняется с размещением служб на одном узле.
В общем, если вы можете вытащить питание и никого не волнует, то он простаивает.
«Ожидание» - это не черно-белое понятие: даже у загруженного сервера могут быть свободные циклы ЦП, IOP и память для выполнения какого-либо другого приложения.
Как показывает практика, целевая загрузка ЦП должна составлять около ~ 80%, но не выше ~ 90%, так как максимальное значение ЦП значительно увеличивает задержку системы. Загрузка ЦП ниже ~ 60% обычно означает, что ваш сервер недостаточно загружен.
Также учтите, что рабочая нагрузка, сильно зависящая от ввода-вывода, будет обременять диски, но ЦП будет в основном простаивать (wait
время в терминах Linux), так что, возможно, вы сможете выполнить вычисления с высокой загрузкой ЦП на сервере с загрузкой ввода-вывода без значительного снижения производительности.
Что это за операционная система и каково предназначение сервера?
Если бы у меня не было другой информации, и мне нужно было определить, простаивает ли сервер, я бы проверял, какие службы были установлены / запущены, а затем регистрировал некоторую сетевую активность, специально предназначенную для этих служб. В Linux и Windows есть аудит входа в систему. Windows имеет монитор производительности для мониторинга общей сетевой активности и множество встроенных счетчиков активных сеансов для различных служб. Для файлового сервера вы можете проверить недавно измененные / открытые файлы.
Я не думаю, что какие-либо из перечисленных вами показателей действительно являются хорошими индикаторами активности или бездействия, поскольку существует множество способов получить «ложные срабатывания», в зависимости от того, что вы ищете. Например. антивирусная программа может использовать циклы процессора или диск может быть заполнен неиспользуемыми файлами.
Если вы хотите сообщить мне, какую ОС вы используете и каково предназначение сервера (если вы знаете), я могу отредактировать свой ответ и предоставить вам дополнительную информацию.
Если вы можете удалить его из своей инфраструктуры / сети, не влияя на какие-либо службы, я бы посчитал этот сервер бездействующим.
Термин «бездействие» может быть очень субъективным. Лучше всего собирать ежедневные метрики со всех ваших производственных экземпляров и сравнивать числа. У вас могут быть рабочие нагрузки, которые вы можете распределить по ферме серверов более равномерно, что даст вам более низкую общую среднюю нагрузку. Вы хотите, чтобы все ваши серверы работали в оптимальном режиме - не на высоком, но и не на слишком низком уровне, чтобы максимизировать общую производительность.
Как определить сервер как бездействующий, во многом зависит от контекста, что вы хотите делать с информацией, что сервер был классифицирован как бездействующий. Нет значимого способа классифицировать сервер как бездействующий без контекста.