У меня проблема с связкой DL180, каждый с интеллектуальными массивами P410 с 2 логическими дисками, один для корневой файловой системы, а другой - это файловая система большого размера 10 ТБ, которая экспортируется nfs.
Коробки - это в основном серверы nfs, которые часто перегружены и являются узким местом в цепочке обработки.
Время от времени один из этих логических дисков емкостью 10 ТБ выходит из строя и требует восстановления. это случается примерно раз в месяц, и это больно.
Сообщение: «Сообщение: этот логический диск вышел из строя и не может быть использован. Все данные на этом логическом диске потеряны».
Мы пробовали обновить прошивку на дисковом массиве и в модуле ядра, и для основной ОС использовались различные разновидности Linux, debian, CentOS, а также xfs и ext3 были опробованы в качестве типов файловых систем. Однако логические диски по-прежнему регулярно требуют восстановления из резервных копий.
Я прикрепил диагностический вывод hpacucli для одного из неисправных дисков. http://pastebin.com/9zTiuSAN
несколько интересных элементов вывода;
Smart Array P410 в слоте 1: Определение версии микропрограммы ОЗУ контроллера 2.00 Версия микропрограммы ПЗУ 2.00
Есть ли какие-либо предложения относительно того, в чем может быть проблема, или как я могу использовать эти массивы / диски, чтобы понять, что вызывает сбой диска?
# cat output.txt | grep -B 2 'Drive Firmware Rev'
Drive Model ATA GB1000EAMYC
Drive Serial Number WMATV2509266
Drive Firmware Revision HPG2
--
Drive Model ATA GB1000EAMYC
Drive Serial Number WMATV1739564
Drive Firmware Revision HPG2
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ456MN
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ45RS3
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ460P0
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ454YN
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ4664M
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ457M9
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ46Q9E
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ4630X
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ454PD
Drive Firmware Revision HPG8
--
Drive Model ATA GB1000EAFJL
Drive Serial Number 9QJ45Z0Y
Drive Firmware Revision HPG8
--
Drive Model HP DF0146B8052
Drive Serial Number 3QN1KS7H00009949SQ4M
Drive Firmware Revision HPD5
--
Drive Model HP DF0146B8052
Drive Serial Number 3QN1KNFS00009949UX4F
Drive Firmware Revision HPD5
Диски от HP или другого производителя?
Возможно, что диски HP имеют специально настроенную микропрограмму, и если ваши диски не являются дисками HP, на которых установлена эта настроенная микропрограмма, контроллер RAID может отбрасывать их из массива RAID по разным причинам.
Если это так (диски не HP), я не уверен, что вы найдете окончательный ответ (или, к сожалению, решение), поскольку вы не можете надежно предсказать, как диски будут действовать в этом контроллере RAID, а HP не будет иметь к этому никакого отношения.
У нас была аналогичная проблема с отказом дисков, и статья в базе знаний HP указала, что проблема была во встроенном ПО накопителя. Обновление прошивки должно решить эту проблему. Не удалось открыть ваше сообщение, чтобы узнать, перечислены ли в нем версии прошивки драйверов.