Мы заботимся о сервере Fujitsu RX300 S4, который имеет 6 дисков SATA по 500 ГБ в массиве RAID-6, работающий от карты LSI MegaRAID (встроенной в материнскую плату).
Пару недель назад один жесткий диск пометил себя как неисправный (оранжевый индикатор на отсеке для дисков, программное обеспечение MegaRAIDcli показывает статус микропрограммы «Failed»). Мы заказали и заменили привод, но после начала восстановления другой привод пометил себя как неисправный.
Это случилось уже 3 раза: дважды он отмечал разные приводы, в которых произошел сбой, и один раз отмечал привод, который мы уже заменили.
На данный момент два привода показывают неисправности - мы не знаем, исправны ли приводы. фактически сбой, либо неисправна объединительная плата или карта RAID.
Кто-нибудь испытывал подобное раньше? Есть какие-нибудь советы, что делать дальше? Нам позвонили в Fujitsu, но мы спросили, есть ли у кого-нибудь указатели ...
Я сочувствую тебе. Подобные аппаратные проблемы вызывают стресс и утомляют отладку.
Еще в 2002 году я имел «радость» отлаживать подобную проблему. После того, как было слишком много «Давайте заменим HD» и подобный сервер, массирующий объединительную плату, была фактическая ошибка. Но это был сервер IBM и в любом случае совсем другая история.
Если возможно, протестируйте «неисправные» диски на другом сервере и посмотрите, нормально ли они там работают. Моя нутро подсказывает мне, что в вашем случае дело не в дисках, а в другом. Диски, как правило, так не ломаются.
Это может быть неисправный контроллер. Это может быть ненадежная сила. Это могут быть плохие кабели SATA. Это могло быть просто ужасной неудачей.