Поиск плагинов Nagios, которые проверяют использование памяти на дает много результатов, поэтому сложно понять, какой из них использовать, поскольку пакет плагинов Nagios не содержит плагина для проверки памяти.
Так что мне было интересно, какие другие используют?
Я использую NRPE с Nagios в Linux для хостов Linux.
Я категорически не согласен с Glen M - объем памяти, доступный для кэша и буферов, необходим для обеспечения хорошей производительности практически для всех типов приложений практически на всех типах серверных ОС.
Если вы дождетесь, пока ваш веб-сервер не начнет пейджинг, прежде чем вы узнаете о проблеме, тогда будет слишком поздно.
На удобной рабочей станции я вижу это:
total used free shared buffers cached
Mem: 4135700 2588568 1547132 0 91024 2309052
-/+ buffers/cache: 188492 3947208
Swap: 4192944 156 4192788
Я бы хотел сообщить об использовании как 100 * [used-buffers / cache] / total или 100 * 188492/4135700.
Написание плагина для этого не совсем утомительно. Но есть несколько предложений, которые покрывают это - например, check_mem.pl
Вот небольшой совет, чтобы создать свой собственный:
PCTUSED=`free | awk '/^Mem:/ {tot=$2; } /buffers/ { used=$3; } END { print used*100/tot }'`
Несколько лет назад я написал для этого плагин.
По сути, большинство отчетов о памяти ОС немного ошибочны - данные хранятся в приложениях, но могут быть выпущены в любой момент, если это необходимо.
Что вас, вероятно, действительно волнует, так это то, как часто ваша система должна обращаться к диску для подкачки, т. Е. Начинает ли она сбиваться.
Я использовал vmstat и некоторое регулярное выражение (или, может быть, python с регулярным выражением), чтобы просматривать входящие и исходящие страницы и проверять, прошли ли они определенный порог.
Это потребовало довольно небольшой настройки и мониторинга, но это то, что я использовал лучше всего. Писать плагины для {nagios | старший брат | ксимон | пн}