Назад | Перейти на главную страницу

LSI MegaRAID: что означает «временная ошибка, обнаруженная при обмене данными с PD: -: -: 1»?

У меня есть карта LSI MegaRAID 9260-16i, работающая на сервере, и она продолжает регистрировать ошибку

Controller ID: 0 Transient error detected while communicating with PD: -:-:1

Я нигде не могу найти ничего об этом сообщении (документация, гугл, форумы и т. Д.). Что означает это сообщение?

Очевидно, эта ошибка была связана с типом используемых дисков. LSI ответила на мой запрос в службу поддержки следующим образом:

SAMSUNG HD103UJ не был квалифицирован как совместимый жесткий диск. Ошибка и последующее событие тайм-аута вызваны проблемой связи из-за механизма сообщения об ошибках, используемого жесткими дисками настольного уровня, которые не предназначены для работы с RAID.

Я не знал, что это проблема, но после дополнительных проверок я считаю, что это действительно должно быть корнем проблемы. Я безуспешно менял объединительные платы и кабели SAS, и я провел «стресс-тесты» как виртуального диска ОС (с использованием корпоративных дисков Dell), так и диска DATA (с использованием настольных дисков Samsung), и только при запуске " стресс-тест на DATA-дисках получал ли я эти ошибки.

Итак, я полагаю, что нет другого выхода, кроме как покупать корпоративные диски, например, «Western Digital® RE Enterprise 2 ТБ», который поддерживается LSI. Вот вам и попытки повторно использовать оборудование.

ОБНОВЛЕНИЕ (11 марта 2013 г.)

Контроллер работает с двумя массивами: RAID1 с дисками WD Enterprise и RAID6 с дисками SAMSUNG для настольных ПК. В эти выходные массив RAID1 деградировал. Журнал был переполнен сообщением об ошибке, приведенным в моем исходном сообщении. Странно то, что в массиве RAID1 используются корпоративные диски. Может ли действительно быть проблема с одним из дисков SAMSUNG в другом массиве, а затем один из дисков WD вытесняется из другого массива? Мне это кажется странным.

ОБНОВЛЕНИЕ (29 мая 2015 г.)

Давненько я не занимался этой проблемой. Я считаю, что настоящая причина была связана с источником питания. Я подключил все 4 объединительные платы к одному разъему питания (используя разветвители). На пиках (по потребляемой мощности) диск «выпадал», поскольку не могло быть доставлено достаточно энергии. Я исправил это, просто разделив два разъема питания на две объединительные платы каждый.