Назад | Перейти на главную страницу

Допустимая средняя нагрузка

Мы развернули наш новый почтовый сервер Linux / Exim / Spamassassin в пятницу (всегда неплохо развернуть за день до длинных выходных, когда рядом нет администраторов). В среднем за 15 минут нагрузка колеблется в районе 1,3.

Машина быстро реагирует, а почта доставляется в разумные сроки. Можно ли считать это приемлемым?

Как определенная нагрузка считается приемлемой или неприемлемой? Какие метрики используются?

Средняя загрузка - это значение, которое дает представление о количестве процессоров, необходимых ядру, чтобы иметь возможность выполнять все задачи, когда это необходимо, без ожидания.
В вашем случае, если у вас 2 или более CPU / Core. Нет проблем. Если у вас только 1 процессор с 1 ядром, это означает, что между моментом, когда ваше приложение хочет запустить, и временем его запуска ядром проходит «слишком много» времени. Загрузка> "количество процессоров / ядер" не будет проблемой для почтовой системы, пока она не достигнет слишком высокого значения в течение слишком долгого времени.
Конечно, они не являются правилом и ценностью, и, хотя вы получаете почту в короткие сроки, это нормально. Но вам, вероятно, нужно начать внимательно присматриваться к своему серверу, когда нагрузка превышает 2 * количество процессоров / ядер слишком часто в течение «длительного» периода (~ 1 час).
Опять же для почтового сервера это не будет большой проблемой, но это будет означать, что ваш сервер немного перегружен.

Основное эмпирическое правило: если система реагирует, если она работает своевременно, то все в порядке.

Нагрузки ниже двух не вызывают большого беспокойства. У меня было четыре или пять систем, которые по-прежнему работают нормально, хотя это может указывать на то, что существует много проблем с очередями в сети или дисках (проблемы ввода-вывода могут вызывать высокие нагрузки, даже если система очень отзывчива).

Периодически проверяйте длину очереди почты и журналы на предмет недоставленных проблем и проблем такого характера. Если очередь доставки остается относительно небольшой, это нормально.

Вы можете многое обойтись со средним диском и информацией о сетевом вводе-выводе, но если вы не видите проблем с доставкой (я отправил сообщение пятнадцать минут назад, а оно еще не пришло!), Вы можете работать с системой через консоль ( или ssh) без большой задержки, все будет в порядке.

Как всегда с вопросами, связанными с настройкой, здесь нет ответов да / нет, все зависит от :-)

Сказав это, загрузка 1,3 не кажется высокой, особенно если у вас многоядерная конфигурация процессора. Если число загрузки совпадает с числом ядер, то на всех ядрах всегда есть процесс, готовый к запуску.

В конечном итоге, если, как вы говорите, сообщения доставляются своевременно, производительность в порядке :-)

top

предоставит вам базовые показатели в режиме реального времени.

Средняя загрузка меньше, чем количество имеющихся у вас ЦП, означает, что ЦП сидят без дела. Равный означает, что они все работают в данный момент. Больше означает, что есть процессы, которые могут быть запущены, но застряли в очереди.

Для сверхчувствительных ко времени вещей, таких как сервер VoIP или кэш памяти, вы хотите, чтобы средняя нагрузка была намного меньше количества ядер. Для асинхронных вещей, которые могут существовать с периодическим резервным копированием (например, по электронной почте), вы можете легко запустить в 4 раза больше ядер.

Самая большая оговорка, которую следует помнить, заключается в том, что процессы, ожидающие ввода-вывода диска или сети, но в противном случае работоспособные, по-прежнему отображаются в средней нагрузке. Таким образом, если у вас есть сервер Apache, загружающий jpg-файлы 56 тыс. Пользователей, вы можете запустить гораздо более высокую среднюю нагрузку, чем если бы у вас был ответ php / любой скрипт на прокси-сервер / балансировщик нагрузки через гигабитную локальную сеть. В вашем случае SMTP-соединение с каким-то медленным почтовым сервером, которое требует бесконечной передачи вложения, будет отображать 1 процесс в очереди выполнения, но может быть прервано двадцать раз, чтобы отправить быстрое однострочное электронное письмо в Gmail без проблем.

Толчок доходит до середины нагрузки, как у DOW. На самом деле он никоим образом не измеряет «экономию», люди просто используют его как показатель с очень слабой корреляцией, потому что о нем легко говорить. Сосредоточьтесь на мониторинге показателей, которые вам действительно важны, таких как глубина очереди доставки и количество сообщений в секунду.

Сколько у вас ядер? cat / proc / cpuinfo | процессор grep | wc -l

(предостережение: гиперпоточность выглядит как больше ядер, но это не так)

Если ваш уровень нагрузки ниже вашего процессора, то в целом все в порядке.

Также посмотрите на верхнюю часть и нажмите «1», и вы сможете увидеть индивидуальную нагрузку каждого процессора.

Да, это вполне приемлемо, и в целом этого можно ожидать от почтового фильтра.

Наша установка немного отличается. У нас есть отдельный сервер для SpamAssassin, а наш POP-сервер запускает ClamAV для сканирования на вирусы. Сервер POP обычно работает при нагрузке на сервер 2, но иногда она достигает 10 или более. Наш сервер SpamAssassin, с другой стороны, работал около 2, пока мы также не установили фильтры Openprotect.com, когда он удвоил использование ЦП и теперь работает менее 5 с пиками выше 15. Это все еще приемлемо, потому что мы этого не делаем. есть какие-либо задержки в почте, которые приводят к увеличению очереди почты (мы используем qmail для входящего SMTP), и все еще есть место для экономии использования ЦП / памяти.

По совпадению, очень рекомендую Мунин для мониторинга ваших серверов. Он отлично справляется с визуальной демонстрацией исторических данных и показывает, какие ресурсы у вас есть. Мониторинг в реальном времени с помощью Top (1) вам мало помогает. :)

Да, кстати, развертывание в пятницу перед длинными выходными - это здорово способ проработать все выходные. Особенно для критически важных систем, таких как почтовый сервер.

Как расход памяти? Он стабильный или растет?

Нагрузка вроде не из нормы. Если почтовый сервер реагирует, и почта проходит, я бы сказал, что единственным показателем сбоя, помимо потребления памяти, будет получение неправильных писем (спам).

Имейте в виду, что сегодняшний день будет вашим первым настоящим испытанием. Я бы, наверное, сегодня слегка за этим следил. Если что-то пойдет не так, сейчас самое время.