Я использую аппаратную виртуализацию Xen для нескольких Linux DomU. Один из них продолжает случайным образом отказывать с ошибками ввода-вывода при большой нагрузке ввода-вывода в других DomU.
dmesg
содержит следующее
[885434.196928] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK
[885434.196934] end_request: I/O error, dev sda, sector 1557062
[885434.246997] Aborting journal on device dm-1.
[885438.713821] __journal_remove_journal_head: freeing b_committed_data
[885438.728478] ext3_abort called.
[885438.728698] EXT3-fs error (device dm-1): ext3_journal_start_sb: Detected aborted journal
[885438.729192] Remounting filesystem read-only
А вот второй результат другого происшествия:
[1532214.100163] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK
[1532214.100169] end_request: I/O error, dev sda, sector 3751150
[1532214.100172] Buffer I/O error on device dm-1, logical block 275514
[1532214.100442] lost page write due to I/O error on dm-1
[1547950.515890] sd 0:0:0:0: [sda] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK
[1547950.515896] end_request: I/O error, dev sda, sector 5477734
[1547950.515900] Buffer I/O error on device dm-1, logical block 491337
[1547950.516358] lost page write due to I/O error on dm-1
[1547972.401281] Aborting journal on device dm-1.
[1547950.541130] ext3_abort called.
[1547950.541357] EXT3-fs error (device dm-1): ext3_journal_start_sb: Detected aborted journal
[1547950.541869] Remounting filesystem read-only
[1547950.542125] EXT3-fs error (device dm-1) in ext3_ordered_write_end: IO failure
Секторы действительно различаются в зависимости от сбоя, и я не могу найти никаких ошибок, если проверю диски (которые находятся в md1) из Dom0.
У меня возникли те же проблемы при работе с виртуализацией на основе VMWare ESX перед установкой инструментов VMWare, поэтому я ожидаю проблемы с драйверами, так как нет «Xen Tools» (таких как инструменты VMWare), содержащих специальные драйверы, я не знаю, как исправить проблему.
DomU используют Linux 2.6.24-24-server #1 SMP Tue Aug 18 16:51:43 UTC 2009 x86_64 GNU/Linux
, и основаны на Ubuntu 8.04.3 LTS (hardy)
, тогда как гипервизор и Dom0 Linux 2.6.26-2-xen-amd64 #1 SMP Fri Aug 14 10:19:53 UTC 2009 x86_64 GNU/Linux
на Debian Lenny
.
У кого-нибудь есть идеи, как действовать?
По-видимому, некоторые люди столкнулись с той же проблемой и обсуждали ее в этой почтовой ветке: http://lists.centos.org/pipermail/centos-virt/2009-June/001026.html
Вам стоит попробовать трюк с «xm sched-credit» :).
С уважением, Ромен