Пытаюсь разместить этот вопрос здесь. Я также разместил его на форумах Ubuntu, но без ответов.
Недавно я обновил сервер HP ProLiant DL380 G4 с сервера Ubuntu 10.04 до сервера Ubuntu 12.04.
При этом сервер не будет - в случайное время - достигать нагрузки 400+, а затем полностью перестать отвечать. Я использую программу построения графиков SNMP (кактусы), и нагрузка постоянно увеличивается примерно на 10 каждые пять минут, пока не станет больше 400 и построение графиков не остановится.
Графики могут быть неточными, но загрузка процессора в среднем составляет около 3%, прежде чем это произойдет - и сразу, когда нагрузка начинает увеличиваться, она выскакивает примерно до 25% за 15 минут и резко падает до менее 1% (около 0,3%). пока построение графика не остановится.
Я не могу открыть SSH-туннель к серверу, чтобы что-то сделать. Я проверил / var / log / syslog, и все журналы тоже останавливаются - там больше ничего нет.
Странно то, что сервер по-прежнему отвечает на DNS-запросы для зон, в которых он является авторитетным, в течение этого времени - и с нормальной скоростью.
Просто не знаю, каким будет следующий шаг, чтобы выяснить, что происходит, и как эту проблему можно исправить. Сервер не может оставаться с Ubuntu 10.04 Server, и его необходимо обновить.
Это будет проблема, связанная с вводом-выводом, поскольку диски и все операции записи останавливаются. Ядро и сетевой стек работают в ОЗУ, поэтому сервер доступен для проверки связи.
Главное, что я хотел бы проверить, - это BIOS / прошивка системы и версия прошивки контроллера Smart Array в системе. Это старый ProLiant DL380 G4 (примерно 2005 г.), так что у вас есть либо встроенный контроллер Smart Array 6i, либо контроллер Smart Array 641, либо контроллер серии Smart Array 6400.
Вы можете рассказать нам больше?
Быстрый рост нагрузки происходит из-за того, что процессы блокируются в ожидании ввода-вывода. Вы не говорите, какой тип приложения работает в системе, но похоже, что у вас, скажем, 380+ процессов, ожидающих диска :)
-- редактировать --
Итак, за годы я развернул множество этих серверов. Доступ к прошивке есть? Вы управляете Агенты управления HP? Это даст вам больше информации о том, что вам здесь нужно, и установит подходящие драйверы.
И напоследок ... это действительно старое снаряжение ... Не могли бы вы подумать о модернизации?
Видеть: HP Proliant DL380 G4 - сможет ли этот сервер работать в 2011 году?
-- редактировать --
Пытаться # modinfo cciss
и выложите результат.
[root@MDMarra ~]# modinfo cciss
filename: /lib/modules/2.6.32-279.14.1.el6.x86_64/kernel/drivers/block/cciss.ko
license: GPL
version: 3.6.28
description: Driver for HP Smart Array Controllers
author: Hewlett-Packard Company
srcversion: 712C176F5D360D8C1166F22