Назад | Перейти на главную страницу

ZFS заменяет диски во freebsd, как и когда

У меня следующая конфигурация zpool:

zpool status
    NAME        STATE     READ WRITE CKSUM
    data        ONLINE       0     0     0
      raidz2-0  ONLINE       0     0     0
        da1     ONLINE       0     0     0
        da0     ONLINE       0     0     0
        da3     ONLINE       0     0     0
        da4     ONLINE       0     0     0
        da2     ONLINE       0     0     0
        da5     ONLINE       0     0     0
        da7     ONLINE       0     0     0
        da6     ONLINE       0     0     0
      raidz2-1  ONLINE       0     0     0
        da21    ONLINE       0     0     1  (repairing)
        da14    ONLINE       0     0     0
        da22    ONLINE       0     0     0
        da23    ONLINE       0     0     0
        da13    ONLINE       0     0     0
        da9     ONLINE       0     0     0
        da12    ONLINE       0     0     0
        da20    ONLINE       0     0     0
      raidz2-2  ONLINE       0     0     0
        da11    ONLINE       0     0     0
        da18    ONLINE       0     0     0
        da8     ONLINE       0     0     0
        da10    ONLINE       0     0     0
        da15    ONLINE       0     0     0
        da16    ONLINE       0     0     0
        da17    ONLINE       0     0     0
        da19    ONLINE       0     0     0

da21 имеет 1 сбой CKSUM каждые ~ 2 недели. Нужно ли мне его уже заменить или подождать, пока не появятся новые ошибки? Я довольно осторожен, но и не хочу заменять совершенно исправный диск.

Правильны ли следующие шаги, чтобы сделать это? Официальный гид (https://docs.oracle.com/cd/E23823_01/html/819-5461/gbbvf.html#gbcet) есть промежуточные шаги, которые зависят от "cfgadm", но у меня их нет на freebsd, поэтому я лучше удостоверился, что не делаю глупостей, прежде чем начну пачкать руки.

zpool offline da21
<*physically replace device*>
zpool online daXX
zpool replace data da21 daXX

Могу ли я сделать это во время чистки или подождать, пока чистка закончит / остановит ее?

Любая помощь очень ценится :)

Я бы заменил его сейчас лично. Нет смысла беспокоиться о том, что он выйдет из строя позже, а затем придется бороться за замену.

Это горячая замена? Я просто вытащил старую и вставил новую. Если вы можете избежать этого во время чистки, сделайте это.

da21 имеет 1 сбой CKSUM каждые ~ 2 недели. Нужно ли мне его уже заменить или подождать, пока не появятся новые ошибки? Я довольно осторожен, но и не хочу заменять полностью исправный диск.

Сначала я бы заменил кабель и проверил, сохраняется ли проблема в другом отсеке / другом корпусе / другом контроллере (если это возможно в вашей настройке). В одной из таких ситуаций у меня было больше всего ошибок контрольной суммы. Неисправные диски обычно проявляются ошибками чтения или записи.

Это также было бы практически бесплатно по сравнению с другой полной заменой диска, которую вы все равно можете сделать, если ошибки не исчезнут (особенно на Z2 или Z3, где необходимость действовать намного ниже). Конечно, если вы не можете пойти на малейший риск, вам не следует этого делать - но в этом случае вы бы уже использовали Z3 или несколько зеркал, не так ли? И у вас все еще есть готовая текущая и проверенная резервная копия, поэтому риск очень мал.

Могу ли я сделать это во время чистки или подождать, пока чистка закончит / остановит ее?

Если есть время, я всегда переждал бы скраб. Тогда вы можете быть уверены, что другие диски в vdev также не показывают скрытых ошибок, которые могут привести к серьезным повреждениям, если не будут обнаружены до удаления диска (в зависимости от вашего уровня дополнительных дисков).

Если нет времени, просто отмените скраб нажатием zpool scrub -s <poolname>.