Назад | Перейти на главную страницу

Регулярные сбои системы на рабочей станции RHEL5

У меня есть рабочая станция RHEL5, которая недавно начала "икать". Примерно каждые тридцать секунд он, по-видимому, полностью прекращает выполнение примерно на 4 секунды. Вроде бы в этот период ничего не запускается. Долгосрочные процессы, кажется, догоняют их ввод, но новые процессы просто не запускаются.

Конкретные примеры:

Перезагрузка на некоторое время решает проблему. В последний раз на то, чтобы вернуться, потребовалось шесть дней. Я не уверен, что это соответствует действительности.

Сначала я подозревал, что проблема может быть связана с модулем видеодрайвера nVidia, но я выключил X Windows и удалил модуль, не изменив симптомов.

В dmesg или / var / log / messages нет ничего, что казалось бы отдаленно актуальным или каким-либо образом совпадало бы с икотой. Похоже, это не проблема с жестким диском, так как я ожидал бы, что iowait будет заметным во время периода отсутствия ответа, если бы это было так, но это не так. Маловероятно, что это проблема с оборудованием, так как икота случается довольно часто. Мне не удалось сократить время до миллисекунд, но это довольно стабильные 30/4/30/4/30/4.

Любые идеи?

Мои деньги по-прежнему уходят из строя на жестком диске. У меня были подобные вещи, которые происходили на персональных компьютерах с Windows. И даже старая машина Sun показывала похожие проблемы с зависанием. Однако я не стану утверждать, что я достаточно глубоко погрузился в проблему, чтобы заметить, как секунды выпадают из спящей оболочки. Тем не менее, вы можете захотеть узнать, можете ли вы получить какую-либо информацию из своего RAID-контроллера или иным образом исключить жесткие диски.

У моего сервера тоже икота. Я нашел этот инструмент: http://www.latencytop.org/. К сожалению, икота у меня возникает нерегулярно.