Назад | Перейти на главную страницу

mdadm raid1, сбой диска потерял данные за 14 дней?

Я немного сбит с толку. Однажды вечером у меня умер сервер. Я пошел перезагрузить его и заметил, что он застрял на экране загрузки "GRUB". Затем я заметил, что отказал жесткий диск. Я вставил новый жесткий диск, загрузился в режиме восстановления и переустановил grub.

Сервер загрузился, затем я сказал mdadm повторно синхронизировать новый диск, и все снова стало хорошо.

Пока я не заметил, что на диске по какой-то причине были данные, которым было 14 дней, 26 апреля. Поэтому мне пришлось восстановить более свежую резервную копию, чтобы обновить сервер. Однако меня это беспокоит, почему это произошло?

Спасибо

Полагаю, это могло произойти, если: у вас есть 2 диска - / dev / sda и / dev / sdb в raid1. Например, запись mbr была на / dev / sda. 26 апреля система посчитала, что / dev / sdb неисправна (по ошибке или из-за сбоя программы) и была удалена из рейда. Через две недели / dev / sda выходит из строя, и вы получаете несинхронизированный рейд. Как вы сказали выше, вам нужно настроить mdadm, и я предлагаю настроить smartd (из пакета smartmontools). Smartd пару раз «спасал мне жизнь» :)

P.S. raid1 не является резервной копией, у меня было несколько инцидентов, когда 2 диска одновременно выходили из строя без возможности восстановить с них какие-либо данные.

У вас было зеркалирование RAID1, один из дисков отказал 14 дней назад. Сбой достаточно сильно, чтобы карта перестала писать на нее, но не настолько, чтобы на самом деле работай когда вы пытались читать / писать. Но поскольку он был помечен как сбойный, ваша карта RAID больше не будет его касаться. Затем, 14 дней спустя, возможно, в ответ на другую проблему, вы вынули Другой (более актуальный) диск и заменил его пустым.

Поскольку ваш отказавший диск не был записан в течение двух недель, данные были двухнедельной давности. Это то, что вы синхронизировали со свежим диском, поэтому похоже, что ваш сервер не использовался две недели.

Предположительно, ваш ДРУГОЙ диск (тот, который не вышел из строя две недели назад),

А: по-прежнему хорош и может использоваться для восстановления ваших недавних данных, или
B: также не удалось, хотя и совсем недавно и, возможно, с большей серьезностью

Отказ одного диска в RAID-1 не является катастрофическим и, следовательно, не вызывает никаких признаков неисправности. Ваш компьютер просто продолжает работать на оставшемся исправном диске. Если вы не ведете активный мониторинг своего RAID-массива, вы не узнаете о сбое, пока Другой диск также выходит из строя, что приведет к сбою сервера (не останется рабочих дисков).

Некоторые карты RAID будут сброс флаг сбоя / исправности на диске после перезагрузки при определенных условиях. Глупо такое бывает.

Это очень похоже на то, что случилось с вами.

Возможно, ваш / boot не на raid1? only / (или другие ваши разделы).

Некоторые старые версии grub (думаю, 0.9X) не могли загружаться с устройства mdadm.

Если вы можете загрузить liveCD или аналогичный, возможно, вы сможете смонтировать свой рейд и сохранить данные.