У меня есть микропрограмма 1.54 Raid Controller "Areca ARC-1883IX-12", работающая под управлением OpenSuse 42.3 с гипервизором XEN.
Я использую четыре экземпляра команды копирования для копирования четырех больших двоичных файлов в локальной файловой системе:
cp /arecaDriveMnt/bigfile1.dat /arecaDriveMnt/bigfile1Copy1.dat
Если я создаю эту загрузку сетевого жесткого диска с помощью разных процессов, я получу следующую ошибку в / var / log / messages: Через несколько секунд после того, как эта ошибка возникает в первый раз, пропускная способность ввода-вывода снижается с ~ 500 МБ / с до нуля, и мне нужно перезагрузить компьютер, чтобы снова получить доступ к жестким дискам Raid.
Изменить: ошибка не зависит от сетевого трафика, а также возникает, если я создаю достаточно процессов, копирующих локальные данные на локальный диск.
2018-04-05T14:11:39.267042+02:00 dom0 kernel: [ 3324.524188] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:11:42.499045+02:00 dom0 kernel: [ 3327.756238] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:11:45.731043+02:00 dom0 kernel: [ 3330.988233] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:11:48.963033+02:00 dom0 kernel: [ 3334.220268] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:11:52.195037+02:00 dom0 kernel: [ 3337.452336] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:11:55.427038+02:00 dom0 kernel: [ 3340.684381] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:11:58.659044+02:00 dom0 kernel: [ 3343.916533] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:12:01.891054+02:00 dom0 kernel: [ 3347.148512] arcmsr: executing bus reset eh.....num_resets = 0, num_aborts = 7
2018-04-05T14:12:33.891069+02:00 dom0 kernel: [ 3379.148850] arcmsr14: wait 'abort all outstanding command' timeout
2018-04-05T14:12:33.891093+02:00 dom0 kernel: [ 3379.150370] arcmsr14: executing hw bus reset .....
2018-04-05T14:12:46.923049+02:00 dom0 kernel: [ 3392.181980] arcmsr14: wait 'get adapter firmware miscellaneous data' timeout
Ценность в /sys/block/sdh/device/timeout
является 30
Я не вносил никаких изменений в конфигурацию ОС или Bios Raid Controller. Проблема существует при первоначальной установке openSuse с оптимизированными настройками BIOS по умолчанию и нетронутыми настройками Areca raid.
Я пробовал следующее, чтобы исправить ошибку:
irqbalance.service
У кого-нибудь была подобная проблема, и как вы могли ее исправить?