Я не мог понять, что здесь происходит. Я приложил графики ниже. и, как вы можете видеть, кажется, что процессы идут в ногу со временем обработки Munin. Затем сервер блокируется, и граф гаснет. Я спрашивал в IRC-канале Munin, но не нашел там ответов.
Эта установка Munin была завершена с использованием стандартных пакетов Ubuntu, и он контролирует два сервера, а также сам себя, так что ничего особенного.
Есть идеи, что может быть причиной этого и, в идеале, как это исправить?
Вы уверены, что это вызывает Мунин, а не просто сообщает о проблеме, вызванной чем-то другим? Я говорю это, потому что munin, кажется, работает нормально, сообщая об использовании 130 спящих процессов большую часть дня. Затем примерно через полчаса в 2 часа ночи начинают накапливаться процессы, которые находятся в непрерывном сне.
Вам нужно узнать, что происходит в системе в это время. Если это происходит регулярно, попробуйте запустить экран, а затем выполнить ssh для системы. Затем выполните «while true; do ps awwlx; sleep 60 done». Это приведет к тому, что список запущенных процессов будет отправляться каждую минуту. Затем, когда он снова заблокируется, вы можете снова подключиться к экрану и посмотреть, какие процессы там были, в идеале какие из них были в статусе «D» (непрерывный сон).
Также посмотрите на другие графики, такие как использование памяти и ввод-вывод диска. Дисковый ввод / вывод проходит через крышу? Наверное, да. Увеличивается ли использование памяти? Может ли система подкачать и ломать себя до смерти? Я предполагаю, что у вас есть какой-то процесс или процессы, которые начинают использовать много памяти, заставляя систему заменять себя до смерти. "Ps awwlx" должен показать это, так как также записывается использование памяти.
Еще одна вещь, которую вы можете захотеть запустить на экране, - это «vmstat 1», который каждую секунду отображает строку об использовании системы. Особенно используются числа "swap" и "CPU wa".