Для ознакомления: у меня есть машина со следующими характеристиками:
Машина простояла в Datacenter всего несколько дней. Средняя нагрузка составляет 0,50, и у меня есть следующие разделы:
/ ext4 noatime,barrier=0,errors=remount-ro 0 1 /datos ext4 noatime 0 2
Теперь проблема: через случайные промежутки времени машина зависает, SSH сильно тормозит, и при просмотре htop он говорит, что все ядра забиты системными процессами. http://korrupzion.com/htop.png
Вывод Iostat во время замораживания (получил это, когда мне наконец удалось выполнить команду во время замораживания):
iostat Linux 2.6.35-22-server (charizard) 25/10/10 _x86_64_ (8 CPU) avg-cpu: %user %nice %system %iowait %steal %idle 4,33 0,00 10,38 1,21 0,00 84,07 Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn sda 2,68 269,23 0,01 906918 24 sdb 52,30 897,99 1896,08 3024878 6386976
Вывод Vmstat:
vmstat 1 procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu---- r b swpd free buff cache si so bi bo in cs us sy id wa 0 1 0 5680460 128056 1907340 0 0 115 131 1091 2621 4 9 86 1 4 0 0 5676360 128064 1909036 0 0 1872 52 4606 18143 10 33 57 0
Я подозреваю, что ext4 имеет отношение к этим зависаниям, но я все равно не уверен. Ubuntu был установлен неделю назад, перед отправкой машины в центр обработки данных, до этого у меня была Windows 7 для тестирования производительности и не было никаких зависаний
Пожалуйста, если вы знаете другую команду для отслеживания источника этих зависаний, дайте мне знать, я снова подумываю о форматировании для debian lenny, который был S.O., который я использовал для установки на другую машину без проблем
Спасибо.
РЕДАКТИРОВАТЬ 1: Я перемонтировал "/ datos" с барьером = 0, теперь я отслеживаю, возникнут ли проблемы снова.
РЕДАКТИРОВАТЬ 2: Перемонтирование / datos с барьером = 0 не сработало u.u. Все еще пытаюсь найти решение
Я только что сообщил об ошибке Launchpad, связанной с той же проблемой, пять дней назад. Это также Intel Core i7-930 на материнской плате Intel DX58SO:
https://bugs.launchpad.net/ubuntu/+source/linux/+bug/665796
Скорее всего, ваша проблема такая же, ваше описание слишком совпадает с моей проблемой. Проверьте, не зависает ли прерывание системного таймера во время этих зависаний. Продолжайте работать в терминале:
watch -d grep timer /proc/interrupts
Вам понадобится внешний источник прерываний во время блокировки, чтобы планировщик процессов работал и видел выполнение команды. Пинг вашего компьютера с другого компьютера (с небольшим интервалом) поможет.
Если прерывание таймера перестает увеличиваться во время блокировки, то это та же проблема. Пожалуйста, добавьте информацию о вашей системе в вышеуказанный отчет об ошибке, чтобы мы привлекли внимание разработчиков Ubuntu:
ubuntu-bug -u 665796 -p linux
Испытывали ту же проблему с 10.10, также с Core-i7 930, но с ничтожными 6 ГБ ОЗУ. По исследованиям, это может проблема с регрессией в Xorg - вы используете какую-либо среду рабочего стола с графическим интерфейсом пользователя? Если да, то этот отчет об ошибке может быть актуален для вас: https://bugs.launchpad.net/ubuntu/+source/xorg/+bug/658649
Если бы не удары по процессору, я бы предположил, что это связано с DNS.
Причина, по которой я бы предположил DNS,
Вы проверили файл resolv.conf и подтвердили, что DNS-серверы доступны?