Мой сервер испытывает очень высокие средние скачки нагрузки (> 10, иногда даже> 20) каждые несколько минут.
top показывает, что ЦП не используется, но ожидает операций ввода-вывода:
top - 17:42:28 up 8 days, 8:10, 1 user, load average: 9.01, 10.16, 6.54
Cpu0 : 0.0%us, 0.0%sy, 0.0%ni, 0.0%id,100.0%wa, 0.0%hi, 0.0%si, 0.0%st
Cpu1 : 0.0%us, 0.0%sy, 0.0%ni, 0.0%id,100.0%wa, 0.0%hi, 0.0%si, 0.0%st
dmesg показывает этот вывод снова и снова (я не понимаю, что это значит):
ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x2
ata2.00: BMDMA stat 0x26
ata2.00: cmd ca/00:08:74:c4:24/00:00:00:00:00/ef tag 0 dma 4096 out
res 51/84:01:7b:c4:24/84:00:10:00:00/ef Emask 0x30 (host bus error)
ata2.00: status: { DRDY ERR }
ata2.00: error: { ICRC ABRT }
ata2: soft resetting link
ata2.00: configured for UDMA/33
ata2: EH complete
sd 3:0:0:0: [sdb] 625142448 512-byte hardware sectors (320073 MB)
sd 3:0:0:0: [sdb] Write Protect is off
sd 3:0:0:0: [sdb] Mode Sense: 00 3a 00 00
sd 3:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Любые идеи?
На сервере работает FreeRADIUS, и я подозреваю, что проблема может быть вызвана либо RADIUS, либо сетевым адаптером. Во время некоторых всплесков tcpdump показывал увеличение количества отправляемых / получаемых пакетов RADIUS (но я говорю о десятках пакетов в минуту, а не о тысячах).
Когда я прекращаю работу с RADIUS, ситуация улучшается, но по-прежнему наблюдаются периодические всплески средней нагрузки (хотя и более терпимые).
Кто-нибудь знает, что может вызывать такое поведение, и как я могу точно определить, это RADIUS, сетевой адаптер или что-то еще?
Спасибо
Нет, это либо один диск, либо умирает дисковый контроллер. Это не имеет ничего общего с запущенным программным обеспечением или сетевым адаптером.
Если вы еще не сделали резервное копирование, сделайте его СЕЙЧАС и начните искать оборудование на замену.
Почти идентичный вопрос вроде этого был размещен на SU
Прежде чем перезагружаться или возиться с настройками - выполните резервное копирование (и проверьте его на четность!) Как можно скорее.