У меня есть карта LSI MegaRAID 9260-16i, работающая на сервере, и она продолжает регистрировать ошибку
Controller ID: 0 Transient error detected while communicating with PD: -:-:1
Я нигде не могу найти ничего об этом сообщении (документация, гугл, форумы и т. Д.). Что означает это сообщение?
Очевидно, эта ошибка была связана с типом используемых дисков. LSI ответила на мой запрос в службу поддержки следующим образом:
SAMSUNG HD103UJ не был квалифицирован как совместимый жесткий диск. Ошибка и последующее событие тайм-аута вызваны проблемой связи из-за механизма сообщения об ошибках, используемого жесткими дисками настольного уровня, которые не предназначены для работы с RAID.
Я не знал, что это проблема, но после дополнительных проверок я считаю, что это действительно должно быть корнем проблемы. Я безуспешно менял объединительные платы и кабели SAS, и я провел «стресс-тесты» как виртуального диска ОС (с использованием корпоративных дисков Dell), так и диска DATA (с использованием настольных дисков Samsung), и только при запуске " стресс-тест на DATA-дисках получал ли я эти ошибки.
Итак, я полагаю, что нет другого выхода, кроме как покупать корпоративные диски, например, «Western Digital® RE Enterprise 2 ТБ», который поддерживается LSI. Вот вам и попытки повторно использовать оборудование.
ОБНОВЛЕНИЕ (11 марта 2013 г.)
Контроллер работает с двумя массивами: RAID1 с дисками WD Enterprise и RAID6 с дисками SAMSUNG для настольных ПК. В эти выходные массив RAID1 деградировал. Журнал был переполнен сообщением об ошибке, приведенным в моем исходном сообщении. Странно то, что в массиве RAID1 используются корпоративные диски. Может ли действительно быть проблема с одним из дисков SAMSUNG в другом массиве, а затем один из дисков WD вытесняется из другого массива? Мне это кажется странным.
ОБНОВЛЕНИЕ (29 мая 2015 г.)
Давненько я не занимался этой проблемой. Я считаю, что настоящая причина была связана с источником питания. Я подключил все 4 объединительные платы к одному разъему питания (используя разветвители). На пиках (по потребляемой мощности) диск «выпадал», поскольку не могло быть доставлено достаточно энергии. Я исправил это, просто разделив два разъема питания на две объединительные платы каждый.