Назад | Перейти на главную страницу

Могу ли я что-нибудь сделать с программным RAID 1 в Linux, чтобы исправить временные «плохие» сектора?

В основном у меня есть два идентичных жестких диска, которые находятся в идеальном рабочем состоянии, у них просто нет той устойчивости к вибрации, которая им необходима для окружающей среды, в которой они находятся. (Я делаю обоснованное предположение, что это причина). Диски находятся в конфигурации RAID 1 через программный raid md raid / linux. Затем RAID разделяется с помощью LVM.

Проблема в том, что каждые несколько дней на одном или другом диске 1-5 смежных секторов начинают выдавать ошибки ввода-вывода, но hdparm --write-сектор без проблем возвращает их в рабочее состояние. Диск не синхронизирует перераспределенные или ожидающие сектора в SMART, поэтому я могу только предположить, что ему удается успешно исправить исходные сектора.

Что я хотел бы сделать, так это найти способ, чтобы рейд автоматически возвращался на другой диск для сектора, который он не может прочитать. В настоящее время ошибки в конечном итоге достигают уровня файловой системы и повреждают ее, иногда очень серьезно. Чем дольше остается, тем больше снежный ком.

Я уверен, что диски не на грани отказа, так как они работают по этому сценарию чуть менее 2 лет. Проблема появилась примерно через 6 месяцев.

Я пробовал флаг, который устанавливает приоритет записи на один диск (обычно используется на SSD) на более надежном диске, но безрезультатно. Что еще я могу попробовать? Я готов попробовать альтернативные файловые системы, такие как btrfs, если встроенный рейд будет более надежным. Бортовой «фальшивый» рейд Intel также доступен мне (чипсет H67), но я предполагаю, что по сравнению с ним он плохой. Замена дисков практически невозможна, так как коробка находится в другой стране.

Итак, что вы будете делать, если один из этих вращающихся дисков действительно выйдет из строя?(как и все вращающиеся диски)
Я вам скажу: Вы решите свою проблему.

Когда первый вращающийся диск «выходит из строя» (подмигивание, подмигивание, подталкивание, подталкивание :) Замените отказавший диск на SSD. После восстановления рейда отключите второй диск и замените его на SSD.
Это немного BOFH-ish, но это сработает, и вы будете героем.