У меня есть кластер LAMP, который обменивается файлами через NFS, и иногда один из них будет на некоторое время отключен, когда начнут появляться таинственные процессы сброса.
Может кто-нибудь помочь мне? Единственный способ решить эту проблему - перезагрузить компьютер - при убийстве процессов появляются только новые.
top - 19:43:43 up 104 days, 4:52, 1 user, load average: 27.15, 56.72, 33.31
Tasks: 301 total, 9 running, 292 sleeping, 0 stopped, 0 zombie
Cpu(s): 15.6%us, 77.0%sy, 0.0%ni, 4.2%id, 2.0%wa, 0.0%hi, 1.2%si, 0.0%st
Mem: 8049708k total, 7060492k used, 989216k free, 157156k buffers
Swap: 4194296k total, 483228k used, 3711068k free, 928768k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
840 root 20 0 0 0 0 R 98.0 0.0 6:45.83 flush-0:24
843 root 20 0 0 0 0 R 97.6 0.0 5:50.32 flush-0:25
835 root 20 0 0 0 0 R 96.0 0.0 6:42.44 flush-0:22
836 root 20 0 0 0 0 R 95.0 0.0 6:51.56 flush-0:27
833 root 20 0 0 0 0 R 94.3 0.0 6:27.21 flush-0:23
841 root 20 0 0 0 0 R 93.7 0.0 6:46.97 flush-0:26
2305 apache 20 0 772m 31m 25m S 23.6 0.4 0:07.60 httpd
2298 apache 20 0 772m 31m 25m S 13.6 0.4 0:08.98 httpd
26771 apache 20 0 775m 47m 41m S 10.3 0.6 4:07.97 httpd
2315 apache 20 0 770m 29m 25m S 9.0 0.4 0:07.44 httpd
24370 memcache 20 0 457m 123m 608 S 8.6 1.6 66:20.28 memcached
1191 apache 20 0 770m 30m 26m S 8.3 0.4 0:13.54 httpd
2253 apache 20 0 771m 32m 27m S 8.3 0.4 0:11.75 httpd
3476 varnish 20 0 52.9g 2.0g 20m S 8.0 25.6 0:15.30 varnishd
17234 apache 20 0 775m 50m 45m S 7.0 0.6 9:22.09 httpd
23161 apache 20 0 780m 54m 43m S 7.0 0.7 6:33.40 httpd
Спасибо
Ваша система перегружена запросами на запись на диск и вашей конфигурацией "грязное соотношение" не оптимален для вашей среды.
Для виртуальной памяти можно установить два административных параметра:
Эти dirty_background_ratio
и dirty_ratio
расположенный в /proc/sys/vm/
Эти параметры представляют собой процент памяти.
Если вы установите низкое значение для dirty_ratio
Вы можете увеличить нагрузку на диск, но уменьшите потребление оперативной памяти для управления грязной памятью.
В dirty_background_ratio
- это процент минимальной остаточной памяти, вызвавший остановку записи грязных данных на диск из системы. Это означает, что вы должны найти лучший компромисс между измерением грязных фрагментов, чтобы написать (процесс промывки) и минимальный объем памяти, на котором система будет остановлена в процессе записи.
Отношения для хорошей работы могут быть:
dirty_ratio 90%
dirty_background_ratio 5%
среднее соотношение:
dirty_ratio 40~50%
dirty_background_ratio 10~20%
Причин такого дисбаланса в вашей системе может быть несколько, среди наиболее распространенных причин - недостаточный объем ОЗУ для управления установленным, в других случаях это может быть просто из-за падения производительности памяти, установленной на вашем сервере, по самым разным причинам. вентиляция к неправильному кормлению.
Хотя большая часть проблем связана с ошибками программного обеспечения, многие из этих ошибок, о которых не известно, связаны с плохой конфигурацией оборудования и установленных служб. Особенно в случае с арендованными машинами.
Чтобы помочь тем, кто менее знаком с машинами Linux, вышеупомянутые параметры можно заменить следующим образом:
Постоянный режим:
(запустите эти две команды только один раз, в противном случае отредактируйте этот файл в своем любимом редакторе)
# echo "vm.dirty_ratio = 40" >> /etc/sysctl.conf
# echo "vm.dirty_background_ratio = 10" >> /etc/sysctl.conf
Временной режим:
# echo "40" > /proc/sys/vm/dirty_ratio
# echo "10" > /proc/sys/vm/dirty_background_ratio
Вы можете найти более подробную информацию об этих настройках на эта ссылка
Я нашел следующую ссылку с аналогичным обсуждением:
в последнем сообщении говорится:
The high load average issue is resolved in a newer version of the hpvsa driver (1.2.4-7) that is now released by HP. Contact HP Support to obtain a copy of the new driver.
Если у вас файловая система ext4, проверьте эту ошибку Медленная запись в раздел ext4 - ИНФОРМАЦИЯ: задача flush-253: 7: 2137 заблокирована более 120 секунд. что было исправлено в последних ядрах RHSA-2011-1530 которые вы также можете получить, конечно, от Centos.
У тебя есть EnableMMAP Off
в вашем файле конфигурации Apache?
Если вы отображаете в памяти файл, расположенный в файловой системе, смонтированной по NFS, а процесс на другом клиентском компьютере NFS удаляет или усекает файл, ваш процесс может получить ошибку шины при следующей попытке доступа к содержимому сопоставленного файла.
Для установок, где применяется любой из этих факторов, следует отключить EnableMMAP, чтобы отключить отображение памяти для доставленных файлов.
Не знаю, симптомы ли это, но попробовать стоит