У меня следующая конфигурация zpool:
zpool status
NAME STATE READ WRITE CKSUM
data ONLINE 0 0 0
raidz2-0 ONLINE 0 0 0
da1 ONLINE 0 0 0
da0 ONLINE 0 0 0
da3 ONLINE 0 0 0
da4 ONLINE 0 0 0
da2 ONLINE 0 0 0
da5 ONLINE 0 0 0
da7 ONLINE 0 0 0
da6 ONLINE 0 0 0
raidz2-1 ONLINE 0 0 0
da21 ONLINE 0 0 1 (repairing)
da14 ONLINE 0 0 0
da22 ONLINE 0 0 0
da23 ONLINE 0 0 0
da13 ONLINE 0 0 0
da9 ONLINE 0 0 0
da12 ONLINE 0 0 0
da20 ONLINE 0 0 0
raidz2-2 ONLINE 0 0 0
da11 ONLINE 0 0 0
da18 ONLINE 0 0 0
da8 ONLINE 0 0 0
da10 ONLINE 0 0 0
da15 ONLINE 0 0 0
da16 ONLINE 0 0 0
da17 ONLINE 0 0 0
da19 ONLINE 0 0 0
da21 имеет 1 сбой CKSUM каждые ~ 2 недели. Нужно ли мне его уже заменить или подождать, пока не появятся новые ошибки? Я довольно осторожен, но и не хочу заменять совершенно исправный диск.
Правильны ли следующие шаги, чтобы сделать это? Официальный гид (https://docs.oracle.com/cd/E23823_01/html/819-5461/gbbvf.html#gbcet) есть промежуточные шаги, которые зависят от "cfgadm", но у меня их нет на freebsd, поэтому я лучше удостоверился, что не делаю глупостей, прежде чем начну пачкать руки.
zpool offline da21
<*physically replace device*>
zpool online daXX
zpool replace data da21 daXX
Могу ли я сделать это во время чистки или подождать, пока чистка закончит / остановит ее?
Любая помощь очень ценится :)
Я бы заменил его сейчас лично. Нет смысла беспокоиться о том, что он выйдет из строя позже, а затем придется бороться за замену.
Это горячая замена? Я просто вытащил старую и вставил новую. Если вы можете избежать этого во время чистки, сделайте это.
da21 имеет 1 сбой CKSUM каждые ~ 2 недели. Нужно ли мне его уже заменить или подождать, пока не появятся новые ошибки? Я довольно осторожен, но и не хочу заменять полностью исправный диск.
Сначала я бы заменил кабель и проверил, сохраняется ли проблема в другом отсеке / другом корпусе / другом контроллере (если это возможно в вашей настройке). В одной из таких ситуаций у меня было больше всего ошибок контрольной суммы. Неисправные диски обычно проявляются ошибками чтения или записи.
Это также было бы практически бесплатно по сравнению с другой полной заменой диска, которую вы все равно можете сделать, если ошибки не исчезнут (особенно на Z2 или Z3, где необходимость действовать намного ниже). Конечно, если вы не можете пойти на малейший риск, вам не следует этого делать - но в этом случае вы бы уже использовали Z3 или несколько зеркал, не так ли? И у вас все еще есть готовая текущая и проверенная резервная копия, поэтому риск очень мал.
Могу ли я сделать это во время чистки или подождать, пока чистка закончит / остановит ее?
Если есть время, я всегда переждал бы скраб. Тогда вы можете быть уверены, что другие диски в vdev также не показывают скрытых ошибок, которые могут привести к серьезным повреждениям, если не будут обнаружены до удаления диска (в зависимости от вашего уровня дополнительных дисков).
Если нет времени, просто отмените скраб нажатием zpool scrub -s <poolname>
.