вчера я добавил новые жесткие диски (четыре в качестве raidz1 и один в качестве горячего резерва) на сервер opensolaris, после расширения zpool сервер зависает при записи больших файлов, но не при чтении больших файлов (большие файлы => 1 ГБ).
Конфигурация zpool до обновления выглядела так:
state: ONLINE
NAME STATE READ WRITE CKSUM
storage ONLINE 0 0 0
raidz1 ONLINE 0 0 0
c9t0d0 ONLINE 0 0 0
c9t1d0 ONLINE 0 0 0
c9t2d0 ONLINE 0 0 0
c9t3d0 ONLINE 0 0 0
После обновления zpool выглядит так:
state: ONLINE
NAME STATE READ WRITE CKSUM
storage ONLINE 0 0 0
raidz1 ONLINE 0 0 0
c9t0d0 ONLINE 0 0 0
c9t1d0 ONLINE 0 0 0
c9t2d0 ONLINE 0 0 0
c9t3d0 ONLINE 0 0 0
raidz1 ONLINE 0 0 0
c9t4d0 ONLINE 0 0 0
c9t5d0 ONLINE 0 0 0
c9t6d0 ONLINE 0 0 0
c9t7d0 ONLINE 0 0 0
spares
c9t8d0 AVAIL
Как видите, все диски подключены к сети, и даже контроллер 3Ware 9690SA-4I сообщает мне, что все в порядке:
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
----------------------------------------------------------------------------- -
u0 SINGLE OK - - - 1862.63 RiW ON
u1 SINGLE OK - - - 1862.63 RiW ON
u2 SINGLE OK - - - 1862.63 RiW ON
u3 SINGLE OK - - - 1862.63 RiW ON
u4 SINGLE OK - - - 1862.63 RiW ON
u5 SINGLE OK - - - 1862.63 RiW ON
u6 SINGLE OK - - - 1862.63 RiW ON
u7 SINGLE OK - - - 1862.63 RiW ON
u8 SINGLE OK - - - 1862.63 RiW ON
VPort Status Unit Size Type Phy Encl-Slot Model
----------------------------------------------------------------------------- -
p8 OK u0 1.82 TB SATA - /c9/e0/slt1 SAMSUNG HD203WI
p9 OK u1 1.82 TB SATA - /c9/e0/slt3 SAMSUNG HD203WI
p10 OK u2 1.82 TB SATA - /c9/e0/slt5 SAMSUNG HD203WI
p11 OK u4 1.82 TB SATA - /c9/e0/slt6 SAMSUNG HD203WI
p12 OK u5 1.82 TB SATA - /c9/e0/slt8 SAMSUNG HD203WI
p13 OK u3 1.82 TB SATA - /c9/e0/slt10 SAMSUNG HD203WI
p14 OK u6 1.82 TB SATA - /c9/e0/slt13 SAMSUNG HD203WI
p15 OK u7 1.82 TB SATA - /c9/e0/slt15 SAMSUNG HD203WI
p16 OK u8 1.82 TB SATA - /c9/e0/slt17 SAMSUNG HD203WI
Но когда я начинаю записывать файлы в этот zfs, сервер зависает иногда во время процесса записи, а иногда сразу после записи всего файла, но наверняка сервер зависает ... Чтение больших файлов (7-8ГиБ) на другой стороне не проблема!
Спасибо за ответы!
у.е.
Гвидо
редактировать:
к сведению: сервер работает на svn_111b
редактировать 2:
scrub: scrub completed after 6h20m with 0 errors on Thu Jul 22 00:33:29 2010
Как видите, ошибок файловой системы нет ....
Это ошибка ZFS ARC, которая существует более трех лет и все еще сохраняется!
http://bugs.opensolaris.org/bugdatabase/view_bug.do?bug_id=6522017
Он также выйдет за пределы виртуальных машин гипервизора!