Назад | Перейти на главную страницу

Ubuntu 10.10 Maverick Server блокирует систему через случайные промежутки времени (i7 930; 12 ГБ ОЗУ)

Для ознакомления: у меня есть машина со следующими характеристиками:

Машина простояла в Datacenter всего несколько дней. Средняя нагрузка составляет 0,50, и у меня есть следующие разделы:

 /        ext4    noatime,barrier=0,errors=remount-ro 0 1
 /datos   ext4    noatime                             0 2

Теперь проблема: через случайные промежутки времени машина зависает, SSH сильно тормозит, и при просмотре htop он говорит, что все ядра забиты системными процессами. http://korrupzion.com/htop.png

Вывод Iostat во время замораживания (получил это, когда мне наконец удалось выполнить команду во время замораживания):

iostat
Linux 2.6.35-22-server (charizard)         25/10/10        _x86_64_        (8 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           4,33    0,00   10,38    1,21    0,00   84,07

Device:            tps   Blk_read/s   Blk_wrtn/s   Blk_read   Blk_wrtn
sda               2,68       269,23         0,01     906918         24
sdb              52,30       897,99      1896,08    3024878    6386976

Вывод Vmstat:

vmstat 1
procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa
 0  1      0 5680460 128056 1907340    0    0   115   131 1091 2621  4  9 86  1
 4  0      0 5676360 128064 1909036    0    0  1872    52 4606 18143 10 33 57  0

Я подозреваю, что ext4 имеет отношение к этим зависаниям, но я все равно не уверен. Ubuntu был установлен неделю назад, перед отправкой машины в центр обработки данных, до этого у меня была Windows 7 для тестирования производительности и не было никаких зависаний

Пожалуйста, если вы знаете другую команду для отслеживания источника этих зависаний, дайте мне знать, я снова подумываю о форматировании для debian lenny, который был S.O., который я использовал для установки на другую машину без проблем

Спасибо.

РЕДАКТИРОВАТЬ 1: Я перемонтировал "/ datos" с барьером = 0, теперь я отслеживаю, возникнут ли проблемы снова.

РЕДАКТИРОВАТЬ 2: Перемонтирование / datos с барьером = 0 не сработало u.u. Все еще пытаюсь найти решение

Я только что сообщил об ошибке Launchpad, связанной с той же проблемой, пять дней назад. Это также Intel Core i7-930 на материнской плате Intel DX58SO:

https://bugs.launchpad.net/ubuntu/+source/linux/+bug/665796

Скорее всего, ваша проблема такая же, ваше описание слишком совпадает с моей проблемой. Проверьте, не зависает ли прерывание системного таймера во время этих зависаний. Продолжайте работать в терминале:

watch -d grep timer /proc/interrupts

Вам понадобится внешний источник прерываний во время блокировки, чтобы планировщик процессов работал и видел выполнение команды. Пинг вашего компьютера с другого компьютера (с небольшим интервалом) поможет.

Если прерывание таймера перестает увеличиваться во время блокировки, то это та же проблема. Пожалуйста, добавьте информацию о вашей системе в вышеуказанный отчет об ошибке, чтобы мы привлекли внимание разработчиков Ubuntu:

ubuntu-bug -u 665796 -p linux

Испытывали ту же проблему с 10.10, также с Core-i7 930, но с ничтожными 6 ГБ ОЗУ. По исследованиям, это может проблема с регрессией в Xorg - вы используете какую-либо среду рабочего стола с графическим интерфейсом пользователя? Если да, то этот отчет об ошибке может быть актуален для вас: https://bugs.launchpad.net/ubuntu/+source/xorg/+bug/658649

Если бы не удары по процессору, я бы предположил, что это связано с DNS.

Причина, по которой я бы предположил DNS,

  1. Машина перенесена в новый центр обработки данных
  2. Случайные зависания часто возникают из-за того, что что-то пытается подключиться, и время ожидания

Вы проверили файл resolv.conf и подтвердили, что DNS-серверы доступны?