В предыдущем сообщении я спросил, как восстановить неисправный диск в массиве RAID 5 с 4 дисками. Я смонтировал новый привод (диск 4) вместо неисправного и начал восстановление. Во время восстановления другой диск (диск 2) начал выдавать ошибки ECC и таймауты. В 95% процесса восстановления компьютер перезагружался и зависал на стартовом экране, при этом контроллер (3ware 9500s) показывал ошибку (диск 2 не найден) и типичный шум, исходящий от неисправного диска (диск 2), мог быть слышал. Я выключал и включал компьютер несколько раз, без изменений. Затем я отключил компьютер на час. Включил снова, в свое время отсутствующий диск (диск 2) вернулся на место. Я мог запустить бот-операционную систему, ожидающую восстановления, автоматически запускаемого с контроллера. В определенный момент запущенный контроллер выдал ошибку перестройки и остановил процесс перестройки. Сервер теперь работает с диском 2 с ошибками и диском 4 в состоянии ОК, но его работа ухудшилась, так как процесс восстановления не может быть завершен. Похоже, я в тупике: чтобы все было хорошо, должно быть как минимум 3 диска, однако на одном приводе есть ошибки, а один диск не восстанавливается .. Что я могу попробовать?
Лучше всего восстановить из резервных копий. Но я предполагаю, что у вас их нет, иначе вы бы не задавали вопрос.
Итак, в случае сбоя резервного копирования ваш следующий лучший вариант - скопировать как можно больше данных (из звуков вещей у вас будет по крайней мере пара нечитаемых секторов, которые нельзя будет скопировать) любым предпочтительным для вас методом - file копия, образ диска, копия на уровне диска и т. д. Затем, когда у вас есть данные, вы можете заменить неисправные диски, создать новый массив RAID и скопировать данные обратно.
В противном случае вы можете пройти через дорогостоящий процесс профессионального восстановления данных или просто смириться с потерей данных и двигаться дальше, в зависимости от того, сколько ваши данные стоят для вас.
Проще всего восстановить из резервной копии. Но вы, вероятно, задаете этот вопрос, потому что у вас его нет. В этом случае вы позвоните в центр восстановления жестких дисков и посмотрите, что они могут для вас сделать.
Когда вы, наконец, получите это заново, вы узнаете реальную ценность работающей системы резервного копирования.
Можете ли вы показать результат twcli /c0 show all
?
Если диск 2 находится в ECC-ERROR
состояние, вы можете продолжить перестройку, указав контроллеру игнорировать ошибки ECC на диске 2.
@ Ответ Сергея Василова в этой теме Что означает tw_cli 3Ware под «УСТАРЕВШИМ» диском по сравнению с «ECC-ERROR»? имеет правильную информацию. (Раньше я знал это навскидку, но мне пришлось искать команды, и ответ Сергея был первым попаданием в поиске Google, поэтому я отдаю ему должное). Потому что всегда лучше цитировать ответ:
/cx/ux start rebuild disk=p [ignoreECC]
/cx/ux set ignoreECC=on|off
Даже если это позволит вам перестроить массив, у вас все равно может быть повреждение файловой системы или потеря данных. Или нет.
@Daniel, это результат работы tw_cli
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-5 DEGRADED - - 64K 698.461 ON ON
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 233.76 GB 490234752 V503YE9G
p1 ECC-ERROR u0 233.76 GB 490234752 V503Y7VG
p2 OK u0 233.76 GB 490234752 V503Y4GG
p3 DEGRADED u0 465.76 GB 976773168 WD-WCAYUJ776908
Name OnlineState BBUReady Status Volt Temp Hours LastCapTest
---------------------------------------------------------------------------
bbu On Yes OK OK OK 255 18-Nov-2006