Назад | Перейти на главную страницу

рейд 5 эпический провал # 2

следующий-

Часть 1
https://serverfault.com/questions/83262/raid-5-rebuilding-epic-fail,

удалось получить наполовину рабочий контроллер рейда ..

когда мой дистрибутив linux (pmagic) загружается, насколько я могу судить, он видит жесткие диски и пытается смонтировать его как scsi2, но затем он не говорит:

3w-xxxx: scsi2: Command failed: status = 0xc7, flags = 0x59, unit #0
sd 2:0:0:0: WARNING: Command (0x28) timed out, resetting card.

а потом просто зависает и не реагирует на ctrl, alt + delete так что наверное паника ядра?

Я предполагаю, что блок №0 указывает на неисправность жесткого диска в позиции 0 на контроллере рейда. Но если бы это было так, разве рейд-контролер не пропустил бы это?

также есть идеи, что такое флаги и статус? ive пробовал искать в Google, но продолжает возвращать случайные ошибки из независимых источников. Ура

Вы видите таймауты scsi на диске 0.

несколько вопросов:

  1. массив деградировал или вышел из строя?
  2. какие типы жестких дисков, возраст и версии прошивки?
  3. то же самое о самом контроллере

Здесь можно предпринять несколько действий:

  1. если массив работает, но его характеристики ухудшились, обновите версии прошивки жесткого диска и контроллера (сначала драйвер, затем прошивку) и попробуйте выполнить восстановление. Тайм-ауты SCSI часто вызваны ошибками микропрограмм на дисках и контроллерах, а не фактическими ошибками. Если пересборка не удалась - замените диск
  2. если массив вышел из строя, вы можете попробовать повторно пометить массив (очистить конфигурации контроллера, вставить диски, создать новый raid5, похожий на старый, и не позволять контроллеру повторно инициализировать новый массив. затем вытащите диск это не удалось сначала в автономном режиме вручную). Это пометит диски как принадлежащие к массиву и может перевести массив в режим пониженной производительности, а затем использовать вариант 1.
  3. Если данные не важны (т. Е. У вас есть резервная копия), вы можете начать тестирование диска и контроллера, подключив диск к другому разъему на контроллере, чтобы убедиться, что здесь неправильно работает кабель / разъем. или вы можете вместо этого вставить заведомо исправный диск, чтобы проверить разъем - все зависит от вас
  4. переустановка контроллера также может помочь
  5. если это фирменный сервер, вы можете позвонить в службу поддержки, вы, вероятно, услышите то, что я уже сказал, но у специалистов службы поддержки должны быть ссылки на драйверы и прошивки под рукой, и они должны быть в курсе текущих горячих проблем

Да Блок 0 показывает проблему (ы)

Список флагов SCSI http://docs.hp.com/en/A5159-96003/apas01.html