Я использую Ubuntu 14.04 с версией ZOL v0.6.5.4
:
root@box ~# dmesg | egrep "SPL|ZFS"
[ 34.430404] SPL: Loaded module v0.6.5.4-1~trusty
[ 34.475743] ZFS: Loaded module v0.6.5.4-1~trusty, ZFS pool version 5000, ZFS filesystem version 5
ZFS настроена в raidz2 на 6 дисках Seagate SpinPoint M9T 2,5 дюйма по 2 ТБ с включенными кэш-памятью чтения, дедупликацией и сжатием:
root@box ~# zpool status -v
pool: bigpool
state: ONLINE
config:
NAME STATE READ WRITE CKSUM
bigpool ONLINE 0 0 0
raidz2-0 ONLINE 0 0 0
ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0
ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0
ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0
ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0
ata-ST2000LM003_HN-M201RAD_S37<redactedid> ONLINE 0 0 0
ata-ST2000LM003_HN-M201RAD_S34<redactedid> ONLINE 0 0 0
cache
sda3 ONLINE 0 0 0
Каждые несколько дней ящик блокируется, и я получаю такие ошибки, как:
blk_update_request: I/O Error, dev sdh, sector 764218200
blk_update_request: I/O Error, dev sdf, sector 764218200
blk_update_request: I/O Error, dev sde, sector 764218200
blk_update_request: I/O Error, dev sdd, sector 764218200
blk_update_request: I/O Error, dev sdc, sector 764218432
blk_update_request: I/O Error, dev sdg, sector 764218200
smartctl показывает, что диски не записывают никаких ошибок SMART, и все они довольно новые диски. Мне также кажется странным, что все они не работают в одном секторе (за исключением sdc). Мне удалось сделать снимок экрана терминала (я не могу использовать ssh после появления ошибок):
Возможно это сбой контроллера, или ошибка связанная с zfs?
У вас проблема с контроллером, кабелем или объединительной платой. Обратите внимание, как воздействуют на все диски одновременно ...
Я бы также предостерегал от использования дедупликации в такой настройке, если это не является абсолютно необходимым.