В мире информационных технологий я только что дважды выиграл лотерею ...
Сегодня произошел сбой жесткого диска в рейд-массиве. Через несколько часов у нас произошел сбой еще одного диска на другом сервере ... Мы немедленно начали проверять все журналы среды и системы. Влажность 40%, температура 75 *, пыль и другие частицы не летают. Мы проверили журналы ИБП, всплесков не было. Примерно через 3 часа отказал другой жесткий диск в третьей системе ....
Напомним, 3 сервера HP DL380 G7 имеют последовательные серийные номера. Диски не из одной партии, хотя, держу пари, контроллеры массивов и платы. HP выйдет утром ... А пока мы надеемся, что это не станет привычкой ... У нас произошел сбой 1 диска во всей серверной стойке за 2,5 года. Сегодня 3 в течении 12 часов!
Что еще нам следует искать? У кого-нибудь еще была подобная проблема?
Любая помощь приветствуется. Этот инцидент израсходовал наши запасные части .... Если у нас будет еще один сбой, мы будем искать HP, чтобы поменять их.
Обновление: это диски SAS на 146 ГБ со скоростью вращения 10 000 об / мин и один диск SAS на 300 ГБ со скоростью вращения 10 000 об / мин. Оригинальное оборудование HP.
Такие вещи случаются ... Вы были бы удивлены, увидев такое же оборудование в масштабе.
Вы поступили правильно, проверив свою среду на наличие ESD, проблемы с температурой и питанием.
Контроллеры массива, являющиеся устройствами ProLiant DL380 G7, встроены в системную плату. Количество лотов здесь не контролируется слишком жестко. Не думаю, что это не случайно. Тем не менее, это может быть подходящее время для некоторых обновлений прошивки, поскольку ложные сбои дисков иногда являются симптомом плохих версий.
Поскольку у вас есть поддержка, позвольте HP заняться деталями / заменой и двигаться дальше :)
Кстати - было бы полезно подробно описать емкость и тип используемых дисков (SAS, SATA, Nearline SAS)