у нас есть почтовая служба со следующими данными:
1-Centos 6.4
2:Postfix 2.6.6
3:roundcube 0.8
4:dovecot 2.0.9.7
5:mysql-server 5.1.71
все в порядке, но во время пикового использования количество спящих соединений roundcube увеличивается с 1, 2 или 3 до 270 менее чем за 10 минут, а количество открытых файлов apache (измеряется lsof) увеличивается с 4000 до 20000 в это время.
это apache conf: (apache работает в режиме prefork)
PidFile run/httpd.pid
Timeout 60
KeepAlive On
MaxKeepAliveRequests 100
<IfModule prefork.c>
StartServers 8
MinSpareServers 5
MaxSpareServers 20
ServerLimit 256
MaxClients 256
MaxRequestsPerChild 4000
</IfModule>
TraceEnable off
LimitRequestLine 1024
LimitRequestFields 100
LimitRequestFieldsize 1024
LimitRequestBody 10241024
и вот конфигурация mysql:
secure_auth=1
local_infile=0
max_connections = 600
max_allowed_packet = 16M
key_buffer =256M
wait_timeout=240
interactive_timeout=180
connect_timeout=10
innodb_buffer_pool_size=2G
когда спящие соединения roundcube увеличиваются до> 100, почти службы (веб, почта, mysql) падают ....
спасибо за любое предложение.
Сейчас
Примерно через 5 лет
Проблема была обнаружена и решена за несколько дней.
Это было так сложно для младшего системного администратора вроде меня;)
В файловой системе кластера GFS2 возникла проблема, которую мой товарищ по команде подготовил на iSCSI LUN, и эта проблема привела к различным проблемам и проблемам в Dovecot и roundcube (а затем и в apache).
для вашей информации, когда я обращаю внимание на параметр% wa в верхней команде (он был около 90%), я думал (возможно), что есть проблема на уровне файловой системы.
Затем я решил перенести все данные в новую файловую систему кластера (ocfs2), потому что GFS устарела!
Прежде всего, все данные были перемещены в новую кластерную файловую систему (на ocf2), а затем перепроектирована вся система на основе pacemake haproxy на debian wheezy!
Ответ:
У меня есть отредактировать параметр apache max_client на более низкое значение 256 -> 50, почему !?
для (все еще) неизвестной проблемы все предварительно созданные процессы apache используют ЦП примерно на 100% (100% использование этого ядра, на котором запущен предварительно созданный процесс apache в течение нескольких секунд)
Итак, система выходит из строя, потому что в системе 64 ядра процессора, когда все 256 процессов apache используют 100% использование процессора, система и службы отключаются
проблема все еще существует, но у служб нет проблем, я думаю, проблема связана с сетевыми атаками (наши инструменты мониторинга сообщают о многих атаках в день), которые иногда вызывают проблемы, такие как блокировка ресурсов или что-то еще
спасибо за все предложения.