Назад | Перейти на главную страницу

Устройство в программном массиве RAID 10: чистое, деградированное. Ой?

У меня есть 4 диска по 500 ГБ в программном RAID. / dev / md0 - это RAID 1, и подключенный к / boot / dev / md1 - это RAID 10, и swap / dev / md2 - это RAID 10, и это основная система и устройство данных.

Посмотрел сегодня вечером на mdadm и заметил на md2 ...

State : clean, degraded
Number   Major   Minor   RaidDevice State
0       8        3        0      active sync   /dev/sda3
1       0        0        1      removed
2       8       35        2      active sync   /dev/sdc3
3       8       51        3      active sync   /dev/sdd3

При проверке md0 и md1 все диски отображаются как активные, а состояние устройства - как чистое.

Вот полный вывод mdadm для каждого устройства, а также вывод из / proc / mdstat http://pastebin.com/VL0uYdU9

Итак, похоже, что / dev / sdb1 и / dev / sdb2 работают в / dev / md0 и / dev / md1 соответственно. Но / dev / sdb3 выпал (видимо удален) из / dev / md2

Я считаю, что с RAID 10 с данными все в порядке, если только я не потеряю другой диск на противоположной стороне зеркала. Я, конечно, делаю резервную копию на внешнем устройстве и убедился, что оно стабильно.

Я сделал несколько поисковых запросов и заметил эту пару строк журнала ...

Dec  9 04:25:37 hostname smartd[3199]: Device: /dev/sdb, 1 Currently unreadable (pending) sectors
Dec  9 04:25:37 hostname smartd[3199]: Device: /dev/sdb, 1 Offline uncorrectable sectors

Повторяется каждые 30 минут. Похоже, что так было некоторое время, и похоже, что накопитель не прошел проверку данных SMART.

7 января идиот перезагрузил сервер, думая, что это решит проблему с ретранслятором почты.
Вот загрузка из / var / log / messages ... http://pastebin.com/jGVsDD54

Почему / dev / sdb1 и / dev / sdb2 работают нормально, а просто / dev / sdb3 не работает?
Просто конкретный неисправный сектор, который оказался на sdb3?

Стоит ли пытаться повторно добавить этот раздел в массив md2?
Или я должен выбросить диск и заменить его новым?

Отказ SMART указывает на неизбежность полного отказа диска (однако предсказать временные рамки невозможно); замените этот диск как можно скорее.