У нас есть 8-портовая raid-карта 3ware 9650se для нашего основного дискового массива. Нам пришлось отключить сервер из-за предстоящего отключения электроэнергии, и когда мы снова включили машину, рейд-карта так и не запустилась.
Эта карта эксплуатировалась без проблем пару лет и работала до отключения.
Теперь, когда мы включаем машину, опция BIOS, которая обычно запускается перед загрузчиком, не отображается, ни один из дисков не запускается, и когда ОС пытается получить доступ к устройству, он просто истекает.
Прошивка на нем была обновлена в прошлом, поэтому, возможно, мы столкнулись с какой-то ошибкой прошивки.
Мы используем его в машине Silicon Mechanics R272 с gentoo для ОС. ОС в итоге загружается, но, увы, без карты.
Мы заказали новую, но меня беспокоит, что если мы заменим карту, она не распознает существующий массив. Кто-нибудь раньше делал замену карты?
Любая помощь будет принята с благодарностью.
Изменить: это ошибки ядра, которые мы видим:
3ware 9000 Storage Controller device driver for Linux v2.26.02.012.
3w-9xxx 0000:09:00.0: PCI INT A -> GSI 18 (level, low) -> IRQ 18
3w-9xxx 0000:09:00.0: setting latency timer to 64
3w-9xxx: scsi0: ERROR: (0x06:0x000D): PCI Abort: clearing.
3w-9xxx: scsi0: ERROR: (0x06:0x001F): Microcontroller not ready during reset sequence.
3w-9xxx: scsi0: ERROR: (0x06:0x0036): Response queue (large) empty failed during reset sequence.
3w-9xxx 0000:09:00.0: PCI INT A disabled
Поменять карты 3ware довольно безболезненно.
Просто убедитесь, что это та же или более новая модель и что версии прошивки совпадают. Если версии прошивки разные, диски не будут импортированы в контроллер. (был там, сделал это)
Отображается ли старая карта в lspci
вообще? У меня были проблемы, когда настройки BIOS были зашифрованы и карта вообще не отображалась. Мне пришлось повторно включить слот PCI, а также включить MSI, чтобы карты 3Ware снова появились.
Немного информации об использовании raid-карт 3ware 9650 в современных распространенных материнских платах:
Избегайте полноразмерных карт 9650, поскольку они не работают с новыми материнскими платами, BIOS не запускается после мягкого сброса. На старых материнских платах они работают нормально (проверено на платах core2).
Позднее производятся низкопрофильные карты 9650SE, которые прекрасно работают на современных материнских платах uefi и т. Д.
Они все еще работают (возможно, большинство из них были выпущены примерно в 2007 году?)
Не видел еще разряженных аккумуляторов, по прошествии 8-9 лет (пользовались в идеальных условиях, аккумуляторы всегда проверяли, заряжали).
Вы можете переключать карты, но использовать ту же прошивку (или более новую, если такая же версия недоступна). При построении рейдов сначала используйте нижние порты, потому что вы также можете легко переключиться на карту 9650 с меньшим количеством портов, пока более высокие порты не используются на исходной карте.
избегайте первого порта x16 pci express на материнской плате, некоторые материнские платы ожидают наличия там видеокарт, что вызывает странное поведение.
установка 3dm2 и cli работает из коробки в ubuntu (проверено: 14.04LTS, 16.04LTS), просто запустите сценарий оболочки из установки.
Жалко, что 3ware больше нет, это отличные продукты
если вы все еще используете их, к сожалению, пора переключиться на что-то новое. Боюсь, стоит рассмотреть только LSI (теперь Broadband).
После того, как Broadcom купила Avago, они внесли изменения на веб-сайт Avago, драйверы / загрузки для 3ware найти труднее.
Это Дэн, который писал ранее, на этот раз я создал учетную запись :)
В любом случае, теперь, когда мои данные были извлечены .. Я решил поиграть с картой и успех !!
Скачал LiveCD версию Ubuntu 10.04.3 LTS
Загрузился Live и убедился, что карта была обнаружена ('tail / var / log / messages | grep 3w-')
Установил tw_cli из репо следующего парня: http://jonas.genannt.name
Загрузил последнюю версию прошивки (2.08.00.009) из CodeSet 9.3.0.8 для 9500S-8 из http://www.3ware.com/support/downloadpageprod.asp?pcode=9&path=Escalade9500SSeries&prodname=3ware%209500S%20Series
Использовал tw_cli для прошивки (стандартный tw_cli от 3ware не поддерживает это). Я не использовал флаг форсирования и мигал, несмотря на то, что у меня уже была такая же версия.
Перезагрузился, когда мне так сказали.
BIOS теперь работает, как и ожидалось!
RMA мой! @ #. Возможно, мне стоит поделиться этим с 3Ware. Большое спасибо всем за внимание.
У вас должно быть хорошо, я не делал этого с этой конкретной картой, но со многими другими рейд-картами оборудования. Единственное, что я бы посоветовал вам сделать, это бросить карту в другую машину, убедиться, что она работает и находится в тот же уровень BIOS как свою старую карту - понизьте версию, если нужно.
3ware карты есть превосходно при совместимости с массивами. Убедитесь, что прошивка не старше старой карты (насколько вы можете определить), и вы, вероятно, захотите попытаться сохранить ту же серию, если это возможно.
Помните об этих двух, и это просто работает.
Мне довелось выполнить несколько повторяющихся загрузок на машине с 9500S-8, и ее, похоже, постигла та же участь. Я наткнулся на статью о 9650 от 3ware, в которой говорилось, как это исправить. Я не мог поверить в решение 3Ware, что единственный вариант - вернуть карту обратно.
Во всяком случае, мне не удалось применить ни одну из упомянутых магий для оживления BIOS. К счастью, после пары перезагрузок на другой машине он обнаружился правильно после загрузки (BIOS все еще не запускается), обнаружил массив raid, и я могу смонтировать его и получить свои данные.
В дистрибутивах Ubuntu и Fedora отображается вся информация о карте, кроме одной: строка BIOS не найдена. Я собираюсь вытащить свои данные, прежде чем начинать заниматься обновлениями прошивки, тем временем, antiduh, если вы все еще здесь и читаете это, у вас есть дополнительная информация о версии Redhat или драйверах или другой процедуре, которую я могу попробовать ? Я не уверен, что обновление прошивки решит эту проблему ..
Я заменил карту с 8 портами на карту с 12 портами (редактируйте, думая о том, что это 9500, а не 9650), а другая карта обнаружила массив, поэтому у меня были все ожидания, что она будет работать, исходя из моего опыта.
У меня есть стабильная карта 3Ware 9650SE, и ее легко заменить. Я проверил это перед развертыванием, так как у меня есть карты с 4 и 8 портами. Однако в последнее время мой опыт работы с 3ware сильно испортился. Все началось с зависания резервного ящика с 5 дисками по 1,5 ТБ. Контроллер работал нестабильно при большой загрузке (просто распаковка большого tgz-файла) и вылетал в течение дня после тестирования на обгорание. Запасной контроллер работал нормально. Затем вышел из строя второй контроллер, и я отправил последние 4 замены обратно. Все они выходят из строя в течение 48 часов после тестирования на приработку предоставленной прошивки или последней версии. Массив raid 5, состоящий из 5–7 дисков, иногда приводит к настолько сильному сбою системы, что карта не обнаруживается, если система не выключена. Массив raid 5 из 4 жестких дисков также выйдет из строя - но это займет несколько дней вместо часов. Специалисты по контролю качества не будут разговаривать со мной, поскольку я не использую их одобренные материнские платы, но у меня есть 3 разных материнских платы (все Asus, 2 AMD, одна Intel), которые я использую для тестирования, и неисправная карта выходит из строя на всех их. Сбои в основном представляют собой шквал ошибок четности. Обычно можно увидеть сообщения о том, что карта не отвечает и сбрасывается, а затем просто происходит полное зависание и повреждение данных, которыми манипулируют.
Прямо сейчас я не могу доверять картам. Только тест на приработку в течение нескольких дней показывает, будет ли карта стабильна под нагрузкой. Отправка их на гарантийную замену кажется способом просто заменить нестабильную карту на другую!
У меня были отличные результаты с 3ware 9650se. У меня было несколько из них: несколько карт с 2 портами, пара карт с 4 портами и одна карта с 12 портами, которую я использовал по отличной цене. Я обычно вставляю их в слот PCI-e, который используется для видеокарты, и они просто работают.
Хотя я нашел настройку BIOS, которая вызывает сбой. Это называется таймером задержки PCI. Я использую много материнских плат AMD, и для тех, у которых есть эта опция BIOS, по умолчанию будет 64. Если я не установлю 32, все будет стабильно.
В любом случае, я собираюсь обновить один массив до 5 дисков по 2 ТБ, и мне придется поменять контроллеры местами, так что ваши ответы вселили в меня надежду.
Записывается ли информация о массиве на диски? Это как другой контроллер может импортировать массив? (Мне нужно посмотреть, как это делается)
Нам удалось волшебным образом вернуть карту к жизни. Мы вынули карту из машины и вставили ее в совершенно другую машину, на которой запущено что-то redhat с очень новыми драйверами. История гласит, что при первой загрузке raid bios не сработал во время загрузки (как мы это видели), но ядро сообщало о множестве различных ошибок. В конце концов, он смог действительно запустить его, а затем при следующей перезагрузке raid bios снова начал работать, и он загрузился чисто. Мы положили его обратно в машину, и все ожило.
Для меня это звучит как проблема с микрокодом - я видел, как некоторые драйверы для таких вещей, как звуковые карты, программные рейды, видеокарты и т. Д., Загружают какой-то микрокод на карту при ее включении. Если в последний раз что-то пошло не так, или если он был поврежден из-за сбоя питания от ИБП, когда мы потеряли питание (стены в коридоре превратились в водопад), то это, безусловно, объяснит, что произошло.
Подумал, что выложу обновление для всех будущих гуглеров.
Редактировать 3 января 2012 года: @rakslice отметил, что к этим картам часто прилагается резервная батарея. Батарею извлекать не пробовали (не додумались), но идея отличная. Любой другой, у кого есть эта проблема, может захотеть попробовать то же самое. Мы все еще не уверены, исправили ли мы это, потому что ядро Fedora сделало какое-то волшебное рукопожатие, чтобы восстановить карту, или если мы оставили ее без питания достаточно долго, чтобы что-то сбросилось.