Назад | Перейти на главную страницу

ZFS (Freenas) отключает внешне здоровый диск во время чистки

У меня есть конфигурация RAIDZ с 4 дисками, работающая на Freenas 9.1. Ранее я заметил, что один из дисков отключен. Я запустил smartctl, и все диски прошли SMART. Несколько дней назад машина была отключена, пока клиент Windows писал ей (у меня еще нет ИБП). Я подумал, что это могло повредить данные, поэтому снова подключите диск через командную строку. Диск остался в сети без происшествий.

Итак, я решил запустить скраб, чтобы проверить наличие ошибок. Скраб может достичь ~ 50% размера пула, прежде чем компьютер отключит диск самостоятельно. Об ошибках CKSUM не сообщается. SmartCTL по-прежнему показывает все проходящие диски. Zpool Status сообщает, что диск был отключен администратором - очевидно, я сам не отключал диск, поэтому я предполагаю, что, возможно, FreeNAS делает это по какой-то причине.

Диск выглядит нормально, ошибок контрольной суммы нет. Зачем freenas отключать его? Должен ли я проверять любую другую статистику на диске, чтобы убедиться, что это настоящий сбой?

Возможно, диск пытается прочитать сектор и не достигает результатов в окне TLER (временное исправление ошибок) (может быть любым от нескольких секунд до нескольких минут). Вместо того, чтобы пытаться в течение более длительного времени (и, возможно, блокировать весь массив), он сообщает контроллеру, чтобы он отбросил его (или контроллер предполагает, что он мертв и отбрасывает его, что бы ни случилось раньше). Это приводит к OFFLINE положение дел.

Чтобы решить эту проблему, вы можете либо изменить тайм-аут как на диске, так и на контроллере, а затем выполнить еще одну очистку (которая может занять больше времени и временно заблокировать систему), чтобы обнаружить и исправить любые нечитаемые сектора; или вы можете удалить диск и проделать ту же процедуру в другой системе, после чего забрать его обратно; или вы можете просто удалить и заменить его.