Назад | Перейти на главную страницу

Высокая средняя нагрузка при ожидании ввода-вывода

Мой сервер испытывает очень высокие средние скачки нагрузки (> 10, иногда даже> 20) каждые несколько минут.

top показывает, что ЦП не используется, но ожидает операций ввода-вывода:

top - 17:42:28 up 8 days,  8:10,  1 user,  load average: 9.01, 10.16, 6.54
Cpu0  :  0.0%us,  0.0%sy,  0.0%ni,  0.0%id,100.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu1  :  0.0%us,  0.0%sy,  0.0%ni,  0.0%id,100.0%wa,  0.0%hi,  0.0%si,  0.0%st

dmesg показывает этот вывод снова и снова (я не понимаю, что это значит):

ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x2
ata2.00: BMDMA stat 0x26
ata2.00: cmd ca/00:08:74:c4:24/00:00:00:00:00/ef tag 0 dma 4096 out
         res 51/84:01:7b:c4:24/84:00:10:00:00/ef Emask 0x30 (host bus error)
ata2.00: status: { DRDY ERR }
ata2.00: error: { ICRC ABRT }
ata2: soft resetting link
ata2.00: configured for UDMA/33
ata2: EH complete
sd 3:0:0:0: [sdb] 625142448 512-byte hardware sectors (320073 MB)
sd 3:0:0:0: [sdb] Write Protect is off
sd 3:0:0:0: [sdb] Mode Sense: 00 3a 00 00
sd 3:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA

Любые идеи?

На сервере работает FreeRADIUS, и я подозреваю, что проблема может быть вызвана либо RADIUS, либо сетевым адаптером. Во время некоторых всплесков tcpdump показывал увеличение количества отправляемых / получаемых пакетов RADIUS (но я говорю о десятках пакетов в минуту, а не о тысячах).

Когда я прекращаю работу с RADIUS, ситуация улучшается, но по-прежнему наблюдаются периодические всплески средней нагрузки (хотя и более терпимые).

Кто-нибудь знает, что может вызывать такое поведение, и как я могу точно определить, это RADIUS, сетевой адаптер или что-то еще?

Спасибо

Нет, это либо один диск, либо умирает дисковый контроллер. Это не имеет ничего общего с запущенным программным обеспечением или сетевым адаптером.

Если вы еще не сделали резервное копирование, сделайте его СЕЙЧАС и начните искать оборудование на замену.

Почти идентичный вопрос вроде этого был размещен на SU

Прежде чем перезагружаться или возиться с настройками - выполните резервное копирование (и проверьте его на четность!) Как можно скорее.