Назад | Перейти на главную страницу

Рейдовый контроллер Areca «ARC-1883» выходит из строя при большой нагрузке на сеть

У меня есть микропрограмма 1.54 Raid Controller "Areca ARC-1883IX-12", работающая под управлением OpenSuse 42.3 с гипервизором XEN.

Я использую четыре экземпляра команды копирования для копирования четырех больших двоичных файлов в локальной файловой системе:

cp /arecaDriveMnt/bigfile1.dat /arecaDriveMnt/bigfile1Copy1.dat

Если я создаю эту загрузку сетевого жесткого диска с помощью разных процессов, я получу следующую ошибку в / var / log / messages: Через несколько секунд после того, как эта ошибка возникает в первый раз, пропускная способность ввода-вывода снижается с ~ 500 МБ / с до нуля, и мне нужно перезагрузить компьютер, чтобы снова получить доступ к жестким дискам Raid.

Изменить: ошибка не зависит от сетевого трафика, а также возникает, если я создаю достаточно процессов, копирующих локальные данные на локальный диск.

2018-04-05T14:11:39.267042+02:00 dom0 kernel: [ 3324.524188] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:11:42.499045+02:00 dom0 kernel: [ 3327.756238] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:11:45.731043+02:00 dom0 kernel: [ 3330.988233] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:11:48.963033+02:00 dom0 kernel: [ 3334.220268] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:11:52.195037+02:00 dom0 kernel: [ 3337.452336] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:11:55.427038+02:00 dom0 kernel: [ 3340.684381] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:11:58.659044+02:00 dom0 kernel: [ 3343.916533] arcmsr14: abort device command of scsi id = 6 lun = 0
2018-04-05T14:12:01.891054+02:00 dom0 kernel: [ 3347.148512] arcmsr: executing bus reset eh.....num_resets = 0, num_aborts = 7
2018-04-05T14:12:33.891069+02:00 dom0 kernel: [ 3379.148850] arcmsr14: wait 'abort all outstanding command' timeout
2018-04-05T14:12:33.891093+02:00 dom0 kernel: [ 3379.150370] arcmsr14: executing hw bus reset .....
2018-04-05T14:12:46.923049+02:00 dom0 kernel: [ 3392.181980] arcmsr14: wait 'get adapter firmware   miscellaneous data' timeout

Ценность в /sys/block/sdh/device/timeout является 30

Я не вносил никаких изменений в конфигурацию ОС или Bios Raid Controller. Проблема существует при первоначальной установке openSuse с оптимизированными настройками BIOS по умолчанию и нетронутыми настройками Areca raid.

Я пробовал следующее, чтобы исправить ошибку:

У кого-нибудь была подобная проблема, и как вы могли ее исправить?