Я копировал данные из своего пула, чтобы я мог перестроить его с другой версией, чтобы я мог уйти с solaris 11 и на тот, который переносится между freebsd / openindia и т. Д., На днях он копировал со скоростью 20 МБ в секунду, что это почти все, что мой настольный диск может обрабатывать запись по сети. внезапно прошлой ночью он упал до 1,4 МБ, сегодня я запустил zpool status и получил это.
pool: store
state: ONLINE
status: One or more devices has experienced an unrecoverable error. An
attempt was made to correct the error. Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
using 'zpool clear' or replace the device with 'zpool replace'.
see: http://www.sun.com/msg/ZFS-8000-9P
scan: none requested
config:
NAME STATE READ WRITE CKSUM
store ONLINE 0 0 0
raidz1-0 ONLINE 0 0 0
c8t3d0p0 ONLINE 0 0 2
c8t4d0p0 ONLINE 0 0 10
c8t2d0p0 ONLINE 0 0 0
в настоящее время это дисковый массив 3 x1 ТБ. какие инструменты лучше всего использовать, чтобы определить, в чем была ошибка и какой из дисков вышел из строя.
согласно документу администратора
The second section of the configuration output displays error statistics. These errors are divided into three categories:
READ – I/O errors occurred while issuing a read request.
WRITE – I/O errors occurred while issuing a write request.
CKSUM – Checksum errors. The device returned corrupted data as the result of a read request.
в нем говорилось, что низкий счетчик может быть что угодно, от потока мощности до дискового события, но не давало никаких предложений относительно того, какие инструменты проверять и определять с помощью.
Ошибки контрольной суммы возникают, когда данные были прочитаны с диска, но не совпали с ожидаемой контрольной суммой; зашумленный кабель sata может вызвать это повреждение либо во время записи (данные повреждены на пути к диску), либо во время чтения (данные повреждены на пути с диска). Хотя это может быть неисправный диск, скорее всего, это было вызвано ослаблением или защемлением кабеля данных SATA. Попробуйте переустановить кабели на обоих концах или попробуйте другой заведомо исправный кабель.
Что касается определения диска, это зависит от того, какое оборудование вы используете. Для оборудования марки Sun cfgadm -alv
должны предоставить вам серийные номера жестких дисков, соответствующие их логическим именам. Если вы используете порты SATA на материнской плате, номера портов соответствуют целевому идентификатору (2, 3, 4), поэтому первым портом, вероятно, будет t0. На большинстве моих дисков WWN напечатан на этикетке, вы можете обнаружить это, включив многопутевый pfexec stmsboot -e
(видеть: этот вопрос), который будет использовать формат c8tWWNxxxxxxxxd0p0 вместо c8tNd0p0, но, вероятно, только если вы используете контроллер SAS.
Ваш вывод показывает, что ZFS удалось исправить ошибку, восстановив данные с двух других дисков и восстановив избыточность. Это просто позволяет вам вызвать что-то плохое, на данный момент система управления сбоями еще не решила, что на диске было достаточно ошибок, чтобы гарантировать его отключение (что приводит к «ухудшенному» состоянию пула). Я бы дал ему скраб, чтобы убедиться, что каждый байт читается чисто. Больше информации для ошибка ZFS-8000-0P Вот.