Назад | Перейти на главную страницу

три диска с ошибками ECC на 3ware raid за две недели

У меня есть сервер, который я обслуживаю для клиента, это компьютер на базе Intel Nehalem, не новый, но в рабочем состоянии. Он имеет карту 3ware 9650SE-24M8 с 20 подключенными дисками и 4 пустыми слотами, объединенными в 5 массивов raid5. Три из этих массивов состоят из дисков емкостью 2 ТБ, два других - по 3 ТБ. За последние две недели мы потеряли 3 диска по 3 ТБ из одного массива, два в один день. Мы делаем резервные копии каждую ночь, чтобы не было потери данных, но время простоя обходится дорого, как и замена дисков. под потерянным я подразумеваю, что карта сообщает о статусе ошибки ECC. Приводы емкостью 2 ТБ приближаются к 25000 часов работы, 3 ТБ приближаются к 10000 часам работы.

Окружающая температура составляет примерно 25 ° C, в то время как приводы (по данным smart) на холостом ходу около 28-30 ° C. Операционная система - Fedora Linux 13 amd64 (я шесть месяцев пытался обновиться, но не могу получить достаточно стабильную работу, чтобы чувствовать себя готовым к этому).

Я не понимаю, что делать на данный момент, до этого момента было два диска, которые умерли, оба емкостью 1 ТБ и довольно старые, с разницей в несколько месяцев. помощь или предложения?