Я управляю сервером HP ProLiant DL380 G6 для студенческой ассоциации, которую наш университет собирался выбросить. На сервере есть аппаратный RAID-контроллер P410i, который мы используем для RAID 5 с 3 дисками для нашей ОС и RAID 10 с 4 дисками для нашей папки данных Owncloud.
По большей части все работало гладко до недавнего времени, когда мы начали получать много дисковых ошибок, а логические диски переходили в режим только для чтения, пока не были отремонтированы с помощью fsck
. DMESG показывает множество ошибок ввода-вывода и сообщений о сбросе логических дисков за 1 секунду между resetting
и reset successfully
Сообщения:
Помимо отказа батареи кеш-памяти, интеллектуальный массив, похоже, работает нормально, а физические и логические диски не показывают ошибок и имеют статус ОК в hpssacli
. Версия прошивки сильно устарела, версия 1.62-0
. Я пробовал обновить прошивку до последней версии, но у меня возникла та же проблема, что и в вопросе Как я могу обновить прошивку SmartArray P410i на DL360G6? Обычный метод через SPP Auto-Update не работает, но я бы хотел использовать предлагаемое решение только в крайнем случае, поскольку оно может заблокировать наш RAID-контроллер.
Я не уверен, что наши диски выходят из строя или это (ошибка в прошивке) нашего RAID-контроллера, который вызывает проблемы, может ли кто-нибудь дать некоторое представление?
РЕДАКТИРОВАТЬ: загрузочный диск снова находится в режиме только для чтения, а fsck выдает ошибки сегментации
sdb
умирает, так как не отвечает своевременно на команду host bin. Однако, насколько я понимаю, sdb
на самом деле это массив или логический том / диск, поэтому он не представляет собой какой-либо отдельный диск.
Наиболее вероятные причины:
один (или несколько) физических дисков умирает, возможно, из-за урагана перераспределенных секторов. Поддерживают ли ваши физические диски TLER? Это диски корпоративного уровня?
сам контроллер имеет некоторую проблему. Это может быть связано, например, с его возрастом или рабочей температурой.