Назад | Перейти на главную страницу

zpool status сообщает об ошибке… что дальше?

На нашем сервере FreeNAS zpool status дает мне:

  pool: raid2
 state: ONLINE
status: One or more devices has experienced an unrecoverable error.  An
    attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
    using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://www.sun.com/msg/ZFS-8000-9P
 scrub: none requested
config:

    NAME                                            STATE     READ WRITE CKSUM
    raid2                                           ONLINE       0     0     0
      raidz1                                        ONLINE       0     0     0
        gptid/5f3c0517-3ff2-11e2-9437-f46d049aaeca  ONLINE       0     0     0
        gptid/5fe33556-3ff2-11e2-9437-f46d049aaeca  ONLINE       3 1.13M     0
        gptid/60570005-3ff2-11e2-9437-f46d049aaeca  ONLINE       0     0     0
        gptid/60ebeaa5-3ff2-11e2-9437-f46d049aaeca  ONLINE       0     0     0
        gptid/61925b86-3ff2-11e2-9437-f46d049aaeca  ONLINE       0     0     0

errors: No known data errors

Что я должен делать? scrub бассейн?

Тип zpool clear raid2 , чтобы очистить ошибки и начать очистку.

Если после этого ошибка не исчезнет, ​​замените диск.

Более подробная информация об оборудовании может помочь, так что это общий совет. Мои рекомендации для группы потребительских дисков, подключенных к материнской плате ПК, отличаются от тех, что я бы сделал для оборудования корпоративного уровня.

Используйте следующую команду change out / dev / adaX для ваших дисков.

[blackout @ freenas ~] # smartctl -a / dev / ada0 | grep "Последовательный"
Серийный номер: WD-WCC4EXXXXXXXX
также полезный командир [blackout @ freenas ~] # glabel status

Инструмент подскажет, что вам нужно сделать: "Определите, нужно ли заменить устройство".

Инструменты настолько умны, что вам, как человеку-администратору, нужно что-то понять. Необходимые шаги зависят от вашего оборудования и настроек, поэтому вам нужно будет принять некоторые решения на основе ваших знаний о системе.

Взгляните на вывод команды. Похоже на устройство gptid/5fe33556-3ff2-11e2-9437-f46d049aaeca возникает ошибка "WRITE". «1.13M» - это очень высокая частота ошибок, и я подозреваю, что проблема возникает некоторое время, а вы этого не замечаете. Посмотрите, сможете ли вы выяснить, почему, а затем замените диск.

Если у вас есть аппаратный контроллер, у этого контроллера могут быть дополнительные инструменты, которые помогут вам определить характер сбоя.

ZFS может справиться с поврежденными секторами, поэтому не нужно паниковать. Но не игнорируйте и проблему.

В качестве профилактической меры вам также следует регулярно запускать очистку ZFS. Видеть http://doc.freenas.org/index.php/ZFS_Scrubs . Это предупредит вас, когда ZFS впервые столкнется с проблемой, задолго до того, как вы достигнете отметки 1,13M.

Хотя вопрос старый, на него могут взглянуть другие люди.

Если да, помните, что вывод zpool status и zpool status -v относятся ко всем возникшим ошибкам. Это включает в себя ошибки из-за портов SATA материнской платы (если они используются), платы HBA (если они используются), самих кабелей SATA… не только дисков.

Три быстрых диагностических теста - быстро проверьте диск с помощью smartctl, убедитесь, что карта вставлена ​​правильно и не болтается, и попробуйте другой порт или кабель SATA (кабель является частой причиной ошибок чтения / записи).