Назад | Перейти на главную страницу

Flush-0: n процессов, вызывающих серьезные узкие места

У меня есть кластер LAMP, который обменивается файлами через NFS, и иногда один из них будет на некоторое время отключен, когда начнут появляться таинственные процессы сброса.

Может кто-нибудь помочь мне? Единственный способ решить эту проблему - перезагрузить компьютер - при убийстве процессов появляются только новые.

top - 19:43:43 up 104 days,  4:52,  1 user,  load average: 27.15, 56.72, 33.31
Tasks: 301 total,   9 running, 292 sleeping,   0 stopped,   0 zombie
Cpu(s): 15.6%us, 77.0%sy,  0.0%ni,  4.2%id,  2.0%wa,  0.0%hi,  1.2%si,  0.0%st
Mem:   8049708k total,  7060492k used,   989216k free,   157156k buffers
Swap:  4194296k total,   483228k used,  3711068k free,   928768k cached

PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                                                           
840 root      20   0     0    0    0 R 98.0  0.0   6:45.83 flush-0:24                                                                                                        
843 root      20   0     0    0    0 R 97.6  0.0   5:50.32 flush-0:25                                                                                                        
835 root      20   0     0    0    0 R 96.0  0.0   6:42.44 flush-0:22                                                                                                        
836 root      20   0     0    0    0 R 95.0  0.0   6:51.56 flush-0:27                                                                                                        
833 root      20   0     0    0    0 R 94.3  0.0   6:27.21 flush-0:23                                                                                                        
841 root      20   0     0    0    0 R 93.7  0.0   6:46.97 flush-0:26                                                                                                        
2305 apache    20   0  772m  31m  25m S 23.6  0.4   0:07.60 httpd                                                                                                             
2298 apache    20   0  772m  31m  25m S 13.6  0.4   0:08.98 httpd                                                                                                             
26771 apache    20   0  775m  47m  41m S 10.3  0.6   4:07.97 httpd                                                                                                             
2315 apache    20   0  770m  29m  25m S  9.0  0.4   0:07.44 httpd                                                                                                             
24370 memcache  20   0  457m 123m  608 S  8.6  1.6  66:20.28 memcached                                                                                                         
1191 apache    20   0  770m  30m  26m S  8.3  0.4   0:13.54 httpd                                                                                                             
2253 apache    20   0  771m  32m  27m S  8.3  0.4   0:11.75 httpd                                                                                                             
3476 varnish   20   0 52.9g 2.0g  20m S  8.0 25.6   0:15.30 varnishd                                                                                                          
17234 apache    20   0  775m  50m  45m S  7.0  0.6   9:22.09 httpd                                                                                                             
23161 apache    20   0  780m  54m  43m S  7.0  0.7   6:33.40 httpd

Спасибо

Ваша система перегружена запросами на запись на диск и вашей конфигурацией "грязное соотношение" не оптимален для вашей среды.

Для виртуальной памяти можно установить два административных параметра:

Эти dirty_background_ratio и dirty_ratio расположенный в /proc/sys/vm/

Эти параметры представляют собой процент памяти.

Если вы установите низкое значение для dirty_ratio Вы можете увеличить нагрузку на диск, но уменьшите потребление оперативной памяти для управления грязной памятью.

В dirty_background_ratio - это процент минимальной остаточной памяти, вызвавший остановку записи грязных данных на диск из системы. Это означает, что вы должны найти лучший компромисс между измерением грязных фрагментов, чтобы написать (процесс промывки) и минимальный объем памяти, на котором система будет остановлена ​​в процессе записи.

Отношения для хорошей работы могут быть:

dirty_ratio 90%
dirty_background_ratio 5%

среднее соотношение:

dirty_ratio 40~50%
dirty_background_ratio 10~20%

Причин такого дисбаланса в вашей системе может быть несколько, среди наиболее распространенных причин - недостаточный объем ОЗУ для управления установленным, в других случаях это может быть просто из-за падения производительности памяти, установленной на вашем сервере, по самым разным причинам. вентиляция к неправильному кормлению.

Хотя большая часть проблем связана с ошибками программного обеспечения, многие из этих ошибок, о которых не известно, связаны с плохой конфигурацией оборудования и установленных служб. Особенно в случае с арендованными машинами.


Чтобы помочь тем, кто менее знаком с машинами Linux, вышеупомянутые параметры можно заменить следующим образом:

Постоянный режим:
(запустите эти две команды только один раз, в противном случае отредактируйте этот файл в своем любимом редакторе)

# echo "vm.dirty_ratio = 40" >> /etc/sysctl.conf
# echo "vm.dirty_background_ratio = 10" >> /etc/sysctl.conf

Временной режим:

# echo "40" > /proc/sys/vm/dirty_ratio
# echo "10" > /proc/sys/vm/dirty_background_ratio

Вы можете найти более подробную информацию об этих настройках на эта ссылка

Я нашел следующую ссылку с аналогичным обсуждением:

0005972: Максимальное время работы и время безотказной работы отображают неправильное среднее значение нагрузки - CentOS Bug Tracker

в последнем сообщении говорится:

The high load average issue is resolved in a newer version of the hpvsa driver (1.2.4-7) that is now released by HP. Contact HP Support to obtain a copy of the new driver.

Если у вас файловая система ext4, проверьте эту ошибку Медленная запись в раздел ext4 - ИНФОРМАЦИЯ: задача flush-253: 7: 2137 заблокирована более 120 секунд. что было исправлено в последних ядрах RHSA-2011-1530 которые вы также можете получить, конечно, от Centos.

У тебя есть EnableMMAP Off в вашем файле конфигурации Apache?

Если вы отображаете в памяти файл, расположенный в файловой системе, смонтированной по NFS, а процесс на другом клиентском компьютере NFS удаляет или усекает файл, ваш процесс может получить ошибку шины при следующей попытке доступа к содержимому сопоставленного файла.

Для установок, где применяется любой из этих факторов, следует отключить EnableMMAP, чтобы отключить отображение памяти для доставленных файлов.

Не знаю, симптомы ли это, но попробовать стоит