Я получаю печально известную ошибку запроса на прерывание хост-адаптера с моим новым RAID-контроллером Adaptec при высоком уровне ввода-вывода. Я прочитал несколько форумов, даже Адаптекс, установка значения 45 для / sys / block / sdX / device / timeout исправит это. Однако я использую Ubuntu Server 12.04, у которого по умолчанию уже установлено значение 45. Я также попробовал следующее предложение, которое заключалось в обновлении биографии моего мобо до последней версии, что я и сделал.
Я не уверен, сталкивался ли кто-нибудь еще с этой ошибкой «aacraid: Host adapter abort request» раньше, даже после выполнения этих шагов.
Вот что я вижу в своем системном журнале:
kernel: [ 5493.523282] aacraid: Host adapter abort request (4,0,0,0)
Jan 6 20:29:15 server kernel: [ 5493.523309] aacraid: Host adapter abort request (4,0,0,0)
Jan 6 20:29:15 server kernel: [ 5493.523375] aacraid: Host adapter reset request. SCSI hang ?
Вот мой uname -a
Linux server 3.2.0-29-generic #46-Ubuntu SMP Fri Jul 27 17:03:23 UTC 2012 x86_64 x86_64 x86_64 GNU/Linux
Спасибо всем,
Джим
Если ваш RAID-контроллер Adaptec имеет собственную прошивку / BIOS, вам может потребоваться обновить ее. У нас были проблемы во время большого количества операций ввода-вывода, и мы получили «aacraid: запрос на прерывание хост-адаптера», а также увидели более новую версию прошивки, чем текущая, в которой говорилось: «Исправлена проблема, из-за которой микропрограмма могла зависать при высокой нагрузке на ввод-вывод». http://download.adaptec.com/pdfs/readme/relnotes_arc_fw-b18937_asm-18837.pdf.
В приведенных выше примечаниях к выпуску перечислены следующие модели Adaptec: 2045, 2405, 2405Q, 2805, 5085, 5405, 5405Z, 5445, 5445Z, 5805, 5805Q, 5805Z, 5805ZQ, 51245, 51645, 52445).
У нас также есть такие строки журнала, как:
sd 0:0:0:0: timing out command, waited 360s
и
Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK
Выполняя поиск в Интернете, чтобы увидеть, как другие люди сталкиваются с подобной проблемой, мы обнаружили другую линейку карт, в которой с помощью прошивки были исправлены следующие проблемы, которые могли иметь значение:
Вышеупомянутые два применимы к моделям Adaptec 7805, 7805Q, 78165, 71605E, 71605, 71605Q, 71685, 72405, 8805, 8885, 8885Q и 81605ZQ.
Если вы еще не решили эту проблему, я недавно столкнулся с той же проблемой, которая быстро переросла в массив, который зависает каждые 5 минут в течение пары минут по мере увеличения ввода-вывода. Ubuntu по умолчанию использует планировщик CFQ, который не оптимален для аппаратного RAID. Переключите планировщик на noop с помощью:
echo noop > /sys/block/<blockdevice>/queue/scheduler
Лично я застрял со старым ядром, но мне сказали, что обновление до последней версии драйвера aacraid должно решить проблему - хотя я не могу это проверить. Но даже в этом случае переключитесь на noop. Поскольку sysfs не является постоянным, вы можете установить планировщик в /etc/rc.local
или используйте elevator=
параметр загрузки.
Я бы обратил внимание на другие параметры ядра, а также на настройки в Ubuntu - разумные значения по умолчанию для наиболее распространенного оборудования, но в большинстве случаев серверы требуют особого внимания, независимо от того, какой дистрибутив вы используете.