Я получаю такие сообщения в системном журнале.
rsyslogd-2177: imuxsock lost 21869 messages from pid 3418 due to rate-limiting
rsyslogd-2177: imuxsock begins to drop messages from pid 3427 due to rate-limiting
Мой сервер перестает отвечать на запросы в течение последних нескольких дней, и мне приходится перезагружать компьютер 2-3 раза.
Пожалуйста, дайте мне знать, что это могут быть за сообщения и могут ли они быть причиной отказа сервера.
Всего несколько секунд назад я решил проблему, из-за которой в течение почти часа простые процессы зависали в загруженном цикле процессора, например, в блокировке или мьютексе. Системный журнал показал эти сообщения:
Jan 9 12:15:43 host1 rsyslogd-2177: imuxsock lost 354 messages from pid 157711 due to rate-limiting
и процесс 157711
был постфикс. service postfix restart
немедленно исправил проблему.
Мой опыт показывает, что сообщение «rsyslogd-2177: imuxsock потерял xxx сообщений от pid yyy из-за ограничения скорости» может появляться в журналах несколько раз. дней после того, как рассматриваемые сообщения журнала были отброшены. Это означает, что вы не можете найти никаких других ссылок на данный pid в текущем файле журнала, и поэтому не можете найти никаких других сообщений от этого pid, которые могли бы сказать вам, что это было.
Предполагая, что вы используете что-то вроде logrotate, просмотр архивных журналов за предыдущую неделю, скорее всего, покажет источник сброшенных сообщений, и вы увидите сообщения, которые запустили флуд, чего может быть достаточно, чтобы понять, что происходит.
Похоже, в вашей системе запущен неконтролируемый процесс ... Возможно, даже ваша машина могла быть взломана (?).
Эти сообщения журнала связаны с Функция ограничения скорости rsyslog. В настоящее время я пытаюсь решить аналогичную проблему на одной из моих машин, хотя моя кажется немного менее серьезной - я теряю только около 100 сообщений журнала за раз. (Например, я вижу "imuxsock потерял 100 сообщений ...")
Если у кого-то есть какие-либо идеи по отслеживанию источника «потерянных» зарегистрированных сообщений, это может быть очень полезно. Я считаю, что моя проблема может быть связана с Postfix, но поскольку идентификаторы процессов (числа "pid"), указанные в сообщении журнала, больше не актуальны (поскольку, по-видимому, процессы больше не существуют), их немного сложно определить. ..
У меня была аналогичная проблема, и она, вероятно, была вызвана сбоем cronjob и попыткой отправить письмо. Эта почта была остановлена, и postfix она не понравилась.