У меня есть массив raidz1 размером 5 x 3 ТБ на сервере ubuntu 14.04.1. В прошлом месяце умер один из дисков (слышен щелчок). Мне удалось заменить диск на zpool replace RAID <dead drive> <new drive>
. Это закончилось без проблем, и бассейн снова был в сети и исправен. Потом умер другой привод. Я попытался сделать то же самое, но пул застрял в следующем состоянии
# zpool status
pool: RAID
state: DEGRADED
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://zfsonlinux.org/msg/ZFS-8000-8A
scan: resilvered 29.1G in 6h3m with 1028 errors on Mon Jan 5 05:35:35 2015
config:
NAME STATE READ WRITE CKSUM
RAID DEGRADED 0 0 1.00K
raidz1-0 DEGRADED 0 0 2.01K
ata-ST3000DM001-9YN166_Z1F15FAV ONLINE 0 0 0
ata-ST3000DM001-9YN166_Z1F15FCJ ONLINE 0 0 0
replacing-2 DEGRADED 0 0 4
17164957131155215254 UNAVAIL 0 0 0 was /dev/disk/by-id/ata-ST3000DM001-9YN166_Z1F15TBH-part1
ata-ST3000DM001-1ER166_W500JFME ONLINE 0 0 0
ata-ST3000DM001-1ER166_Z500765Z ONLINE 0 0 3
ata-ST3000DM001-1CH166_W1F1M2C6 ONLINE 0 0 0
errors: 1028 data errors, use '-v' for a list
Хорошая новость в том, что данные несущественны. Ошибки меня не беспокоят (файлы видео и по-прежнему нормально воспроизводятся). Я попробовал следующие действия, чтобы исправить это, как было предложено в других вопросах и на форумах.
# zpool offline RAID ata-ST3000DM001-9YN166_Z1F15TBH
cannot offline ata-ST3000DM001-9YN166_Z1F15TBH: no valid replicas
# zpool offline RAID 17164957131155215254
cannot offline 17164957131155215254: no valid replicas
# zpool detach RAID ata-ST3000DM001-9YN166_Z1F15TBH
cannot detach ata-ST3000DM001-9YN166_Z1F15TBH: no valid replicas
# zpool detach RAID 17164957131155215254
cannot detach 17164957131155215254: no valid replicas
Я также провел zpool clear RAID
и zpool scrub
который инициировал повторную отправку, но оставил пул в том же состоянии, что и выше. Затем я попытался удалить новый диск, но, как ни странно, получил ту же ошибку отсутствия действительных реплик.
# zpool offline RAID ata-ST3000DM001-1ER166_W500JFME
cannot offline ata-ST3000DM001-1ER166_W500JFME: no valid replicas
Я не понимаю, как действовать дальше. Похоже, замена прошла успешно, но zfs не отпускает исходный диск.
# dkms status -v
spl, 0.6.3, 3.13.0-43-generic, x86_64: installed
zfs, 0.6.3, 3.13.0-43-generic, x86_64: installed
Обновление: я удалил кеш zpool на /etc/zfs/zpool.cache
и перезагрузился. После повторной отправки снова сообщим.
Обновление 2: все еще в том же состоянии, что и выше. Если нет возможности завершить замену, есть ли способ восстановить пул без потери данных?
Обновление 3: вот самый последний статус:
# zpool status
pool: RAID
state: DEGRADED
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://zfsonlinux.org/msg/ZFS-8000-8A
scan: resilvered 29.1G in 6h1m with 1028 errors on Wed Jan 7 03:49:13 2015
config:
NAME STATE READ WRITE CKSUM
RAID DEGRADED 0 0 1.00K
raidz1-0 DEGRADED 0 0 2.01K
ata-ST3000DM001-9YN166_Z1F15FAV ONLINE 0 0 0
ata-ST3000DM001-9YN166_Z1F15FCJ ONLINE 0 0 1
replacing-2 DEGRADED 0 0 0
17164957131155215254 UNAVAIL 0 0 0 was /dev/disk/by-id/ata-ST3000DM001-9YN166_Z1F15TBH-part1
ata-ST3000DM001-1ER166_W500JFME ONLINE 0 0 0
ata-ST3000DM001-1ER166_Z500765Z ONLINE 0 0 0
ata-ST3000DM001-1CH166_W1F1M2C6 ONLINE 0 0 0
errors: 1028 data errors, use '-v' for a list
Данные smartctl для всех 5 дисков Вот.
Пожалуйста попробуйте
zpool в автономном режиме zpool detach
например за первый пост
zpool offline RAID 17164957131155215254
zpool detach RAID 17164957131155215254
У меня был точно такой же статус:
NAME STATE READ WRITE CKSUM
RAIDZ0_01 DEGRADED 0 0 0
raidz1-0 DEGRADED 0 0 0
gptid/4fb5f83e-91b1-11e2-923c-000c292ee274 ONLINE 0 0 0
gptid/50402028-91b1-11e2-923c-000c292ee274 ONLINE 0 0 0
replacing-2 DEGRADED 0 0 0
2345526077585836973 UNAVAIL 0 0 0
was /dev/gptid/72973ce8-f3bf-11e2-9759-000c292ee274
gptid/19062bb3-c67f-11e4-8683-000c292ee274 ONLINE 0 0 0
gptid/d69abb6b-3cd2-11e4-873f-000c292ee274 ONLINE 0 0 0
gptid/51e62469-91b1-11e2-923c-000c292ee274 ONLINE 0 0 0
gptid/528221a4-91b1-11e2-923c-000c292ee274 ONLINE 0 0 0
gptid/53288697-91b1-11e2-923c-000c292ee274 ONLINE 0 0 36
gptid/c8d9e708-cc4a-11e3-99b3-000c292ee274 ONLINE 0 0 0
logs
gptid/ade4947f-e365-11e3-8230-000c292ee274 ONLINE 0 0 0
cache
gptid/f0017430-e364-11e3-8230-000c292ee274 ONLINE 0 0 0
errors: 802342 data errors, use '-v' for a list
Помимо того, что вы пробовали, я также обновил Freenas, но безрезультатно. В моем случае, однако, я был вынужден удалить старый диск и физически заменить его новым. Я решил выделиться жирным шрифтом и «отсоединить» диск через веб-интерфейс. Это немедленно изменило статус пула с «деградированный» на «онлайн».