Назад |
Перейти на главную страницу
рейд 5 эпический провал # 2
следующий-
Часть 1
https://serverfault.com/questions/83262/raid-5-rebuilding-epic-fail
,
удалось получить наполовину рабочий контроллер рейда ..
когда мой дистрибутив linux (pmagic) загружается, насколько я могу судить, он видит жесткие диски и пытается смонтировать его как scsi2, но затем он не говорит:
3w-xxxx: scsi2: Command failed: status = 0xc7, flags = 0x59, unit #0
sd 2:0:0:0: WARNING: Command (0x28) timed out, resetting card.
а потом просто зависает и не реагирует на ctrl, alt + delete
так что наверное паника ядра?
Я предполагаю, что блок №0 указывает на неисправность жесткого диска в позиции 0 на контроллере рейда. Но если бы это было так, разве рейд-контролер не пропустил бы это?
также есть идеи, что такое флаги и статус? ive пробовал искать в Google, но продолжает возвращать случайные ошибки из независимых источников. Ура
Вы видите таймауты scsi на диске 0.
несколько вопросов:
- массив деградировал или вышел из строя?
- какие типы жестких дисков, возраст и версии прошивки?
- то же самое о самом контроллере
Здесь можно предпринять несколько действий:
- если массив работает, но его характеристики ухудшились, обновите версии прошивки жесткого диска и контроллера (сначала драйвер, затем прошивку) и попробуйте выполнить восстановление. Тайм-ауты SCSI часто вызваны ошибками микропрограмм на дисках и контроллерах, а не фактическими ошибками. Если пересборка не удалась - замените диск
- если массив вышел из строя, вы можете попробовать повторно пометить массив (очистить конфигурации контроллера, вставить диски, создать новый raid5, похожий на старый, и не позволять контроллеру повторно инициализировать новый массив. затем вытащите диск это не удалось сначала в автономном режиме вручную). Это пометит диски как принадлежащие к массиву и может перевести массив в режим пониженной производительности, а затем использовать вариант 1.
- Если данные не важны (т. Е. У вас есть резервная копия), вы можете начать тестирование диска и контроллера, подключив диск к другому разъему на контроллере, чтобы убедиться, что здесь неправильно работает кабель / разъем. или вы можете вместо этого вставить заведомо исправный диск, чтобы проверить разъем - все зависит от вас
- переустановка контроллера также может помочь
- если это фирменный сервер, вы можете позвонить в службу поддержки, вы, вероятно, услышите то, что я уже сказал, но у специалистов службы поддержки должны быть ссылки на драйверы и прошивки под рукой, и они должны быть в курсе текущих горячих проблем