Назад | Перейти на главную страницу

Касание тома ZFS вызывает зависание ОС, диски, как сообщается, в порядке

У меня возникли серьезные проблемы с 4 новыми дисками WD Red емкостью 3 ТБ, которые я только что получил. Попытка настроить raidz2 с использованием «родного zfs» со всеми четырьмя на ubuntu 14.04.1, который изначально работает, пока я не попытаюсь скопировать данные на смонтированный том.

Я запустил плохие блоки на всех 4 дисках, и все вернулось нормально. Я провел расширенные тесты SMART на всех 4 дисках, и все в порядке.

Подумал, что, возможно, таймер idle3 может вызывать проблемы, поскольку я заметил, что диски переходят в спящий режим довольно часто, даже когда я пытался скопировать на них данные (что за?), Поэтому я схватил инструмент wd5741, который, если я правильно помню, не не работает, но idle3-tools успешно остановил переход дисков в ждущий режим - никогда.

на сегодняшний день системный журнал по-прежнему сообщает об ошибках, например:

ata7.00: exception Emask 0x10 SAct 0x0 SErr 0x1910000 action 0xe frozen
ata7: SError: { PHYRdyChg Dispar LinkSeq TrStaTrns }
ata7.00: failed command: READ DMA

end_request: I/O error, dev sdc, sector 377981880

ata5.00: device reported invalid CHS sector 0

ata6.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
ata6.00: failed command: WRITE DMA EXT

для всех 4 томов, ata5-8 и / dev / sdc-f, когда процессы, обращающиеся к этим дискам, начинают блокироваться.

Как только эти диски блокируются, любые процессы, которые их касаются, блокируются, даже если они просто пытаются перечислить содержимое каталога (которое не было в списке в последнее время) тома, будут зависать.

Только 2 диска когда-либо сообщали об ошибке «WRITE DMA EXT», но я подозреваю, что это произошло с того момента, когда мне пришлось принудительно перезагрузить машину, потому что устройства были «заняты» (выполняя что-то, что я не мог обнаружить или остановить ...)

Другие темы, которые я проверял, большинство людей заменяют диски, чтобы решить проблему, но они находят ошибки с помощью проверок SMART - я нет.

Мне приходилось уничтожать и воссоздавать пул ZFS примерно 5 раз, пытаясь решить эту проблему. Один раз переустановил сервер ubuntu с минимальным ПО.

Идеи заканчиваются после 2 дней усилий ..

ОБНОВЛЕНИЕ: запустить копию за ночь в пул ZFS с двумя дисками, на которых еще не было проблем с записью. Он замерз. Я не вижу, когда и сколько он скопировал, потому что, когда я пытаюсь запустить ls или sudo mount или почти все, что я получаю ошибки файла не найден. Так что, если ядро ​​не решило, что отключение системного диска было хорошей идеей, я бы сказал, что мой контроллер SATA или неисправен, что означает, что материнская плата, вероятно, выходит из строя. При этом сегодня утром я понял, что это по крайней мере 5 лет, 2 из которых были потрачены на работу 24/7, так что пришло время заменить его :( Буду обновлять этот пост любыми другими новостями.

Оказывается, мой контроллер SATA определенно мертв. Я заменил все, что мог, но даже при загрузке иногда просто не обнаруживает подключенных дисков, поэтому трудно указать на что-нибудь еще.

Спасибо тем, кто комментировал и пытался помочь :)