По опыту я узнал, что каждый жесткий диск выйдет из строя, это просто вопрос времени.
Я усвоил урок на собственном горьком опыте и теперь занимаюсь резервным копированием.
Когда я покупаю новый диск, я часто разделяю список дисков с гарантийным сроком. Производители жестких дисков созданы для того, чтобы зарабатывать деньги, и, очевидно, в большинстве случаев они проектируют свой жесткий диск так, чтобы прослужить хотя бы гарантийный срок. Так что после этого периода я ожидаю, что процент отказов будет больше. У меня уже было 2 из 3 дисков RAID 5, которые вышли из строя почти одновременно (второй диск вышел из строя при восстановлении массива, и да, у меня была недавняя резервная копия).
Мой вопрос: как лучше всего проводить профилактическую замену жесткого диска в RAID-массиве после гарантии?
Тебя это волнует? Сколько дисков в массиве вы заменяете?
Примечания к ответам
При создании нового массива: используйте диски другого производителя / партии.
При наличии уже старого массива: добавьте новый запасной.
В Исследование Google о частоте отказов жестких дисков показали, что корреляция с возрастом меньше, чем предполагалось ранее. Лучший совет, который я слышал, - избегать создания массивов дисков из одной партии или одного производителя. Исследование Google показало, что существует сильная корреляция между одновременным отказом дисков одной производственной партии.
Если вас беспокоит надежность набора данных RAID, я настоятельно рекомендую перейти на RAID10 или отказать в этом RAID6.
Учитывая среднее время безотказной работы и частоту ошибок на 1 Гб чтения, вероятность двойного сбоя при восстановлении деградированного набора RAID5 слишком высока для удобства использования имеющихся на рынке дисков размером в терабайт. ссылка http://hardware.slashdot.org/hardware/08/10/21/2126252.shtml
Это зависит от того, говорите ли вы об оборудовании серверного или настольного класса.
Если это настольный компьютер, построенный на ваши собственные деньги и стандартные диски, и вы не беспокоитесь о совместимости, то да, ваша стратегия верна. Каждые X лет покупайте новые диски, чтобы заменить существующие. Они будут быстрее, тише и крупнее. Вы можете заменить диски по отдельности, позволяя массиву восстановить себя, а затем, когда восстановление будет завершено, перенастроить свой массив, чтобы он был больше. (Не все рейдовые адаптеры поддерживают подобные операции - онлайн-перестройку и изменение размера.)
Если это машина серверного класса, такая как HP Proliant или IBM System X, все становится сложнее. Возможно, вам придется использовать жесткие диски из списка совместимости для вашего raid-адаптера. В этом случае диски будут дорогими, потому что они, вероятно, больше не производятся, или в любом случае они просто дороги для начала для вещей серверного класса. Хуже того, вы можете покупать восстановленное оборудование у своего торгового посредника и не знать об этом - это не редкость для торговых посредников серверов.
Кроме того, вы можете выбросить диски с очень хорошим сроком службы и заменить их дисками, у которых возникнут проблемы. Вместо того, чтобы заблаговременно заменять их, имеет больше смысла построить сервер с горячим резервом для начала и убедиться, что ваш массив рейдов поддерживает автоматическое восстановление с использованием горячего резерва. Тогда восстановление произойдет еще до того, как вы встанете с постели, чтобы добраться до центра обработки данных, и вы сможете заменить неработающий диск на досуге, не тратя ни денег, ни времени.
Я на 100% согласен с тем, что одна и та же партия дисков выходит из строя одновременно. У меня 10 рабочих станций dell, через 4 года у меня 6 дисков выходили из строя с интервалом в 12 месяцев.
Что касается производственных серверов, я всегда покупал их в таких местах, как Dell, и следил за тем, чтобы у них были запасные части, по крайней мере, на то время, в течение которого я планировал поддерживать сервер в эксплуатации, обычно 4 года.
У меня было 3 сервера с RAID, у меня отказал диск. У меня никогда не было «горячего» резерва, но на следующий день компания dell заменила меня, и восстановление было выполнено в кратчайшие сроки. Это плюс правильное резервное копирование, и все будет в порядке.
Можно попробовать использовать raid6. Он может выдержать 2 отказавших диска, обязательно всегда имейте диск горячего резерва.