Я все еще пытаюсь избежать сбоев в моей системе Solaris 11. Недавно во время краша был написан дамп ядра. Изучая это с помощью mdb,
> $C
ffffff0021c09430 vpanic()
ffffff0021c09460 vcmn_err+0x2e(3, fffffffff7a8a830, ffffff0021c09520)
ffffff0021c09550 zfs_panic_recover+0xae()
ffffff0021c09610 dmu_buf_hold_array_by_dnode+0xbd(ffffff05207b5018, 400000, 20000, 0, fffffffff7a85ce0,
ffffff0021c09654, ffffff0021c09658, 0)
ffffff0021c096b0 dmu_write_uio_dnode+0x50(ffffff05207b5018, ffffff0021c09a10, 20000, ffffff051efd0788)
ffffff0021c09700 dmu_write_uio_dbuf+0x58(ffffff05207b2320, ffffff0021c09a10, 20000, ffffff051efd0788)
ffffff0021c09960 zfs_write+0x843(ffffff051f120900, ffffff0021c09a10, 0, ffffff04e4b6adb0, 0)
ffffff0021c099d0 fop_write+0xa6(ffffff051f120900, ffffff0021c09a10, 0, ffffff04e4b6adb0, 0)
ffffff0021c09aa0 vn_rdwr+0x1bd(1, ffffff051f120900, ffffff051fb2e0c0, 20000, 400000, 1, 0, fffffffffffffffd,
ffffff04e4b6adb0, ffffff0021c09ad8)
ffffff0021c09b20 zfs_replay_write+0xe3(ffffff04eb2b4200, ffffff051fb2e000, 0)
ffffff0021c09b60 zil_replay_wr_task+0x2d(ffffff04eb57ea00)
ffffff0021c09c00 taskq_thread+0x22e(ffffff051ede9810)
ffffff0021c09c10 thread_start+8()
Как узнать, какая часть стека вызвала сбой?
Есть ли у вас какие-либо сообщения системного журнала, которые могут вам помочь? Я быстро взглянул на исходный код OpenSolaris и dmu_buf_hold_array_by_dnode
может вызвать панику с "zfs: доступ к прошлому концу объекта". Затем я нашел хорошая публикация на zfs-Discussion на opensolaris.org это немного объясняет, что делать дальше.
pstack core
Хотя мой опыт работы с Solaris 11 невелик, раньше второй адрес был полезным местом для начала разборки.
затем в mdb
::stack
> <address>::dis