Назад | Перейти на главную страницу

Как рассчитать вероятность поломки устройства хранения данных?

Есть много разных носителей. Назвать несколько:

Допустим, я сохранил некоторые файлы на определенном носителе. Как мне рассчитать вероятность того, что носитель / устройство сломается в течение X единиц времени, и я не смогу получить доступ к содержимому?

Есть ли хорошие источники, которые предоставляют такую ​​статистику и формулы для разных устройств и типов носителей?

Если возможно, мне нужны числа и формулы. Использование схемы резервного копирования типа «сын, отец и дедушка», где дедушка дублируется и хранится в двух разных безопасных местах, действительно может быть хорошим советом. Но я хочу иметь возможность рассчитать вероятность отказа устройства / носителя на основе некоторой реальной статистики.

Начнем с жестких дисков. Есть три хороших исследования, дающих реальную статистику по достаточно большому количеству из них, чтобы быть интересными: Университет Карнеги-Меллона, Google, и NetApp. Статистические данные, которые что-то значат, - это ежегодная частота отказов (AFR), как часто привод выходит из строя в течение данного года. Один неудивительный результат, который показывают эти исследования, заключается в том, что производитель указывает как Среднее время до отказа дико занижает вероятность отказа диска через год. Цифры меняются в зависимости от условий, эмпирическое правило, которое я извлек из них, заключается в том, что в лучших условиях с хорошим оборудованием вы можете достичь 2% AFR, но вы должны ожидать AFR в худшем случае ближе к 10%.

Если у вас есть два устройства с копиями одних и тех же данных, и их шансы на отказ статистически независимы, вы можете просто умножить эти проценты, чтобы получить вероятность отказа обоих. Например, учитывая два жестких диска с 5% отказов (разумное среднее значение), вероятность того, что вы потеряете оба из них в заданный год, составляет 5% * 5% = 0,25%. Теперь, если оба диска находятся в одной системе, вероятность того, что что-то вытащит из строя оба диска, намного выше, чем это - они далеки от независимости - так что фактические шансы здесь находятся где-то между 5% и 0,25%; невозможно подойти ближе, не копаясь в статистике таких вещей, как сбой контроллера и источника питания. Видеть Стандартные уровни RAID для получения дополнительных примеров и фона здесь.

Возвращаясь к исходному вопросу, а как насчет других типов медиа? Несмотря на то, что MTBF Скорость оказалась очень оптимистичной для жестких дисков, для многих других типов носителей это лучший рейтинг, который вы найдете. Вы можете комбинировать MTBF или его родственника MTTF нескольких устройств, используя Онлайн-калькулятор надежности. Возможно, вам удастся найти некоторые реальные исследования других типов носителей, которые вы рассматриваете, которые помогут вам найти для них более реалистичные цифры MTBF, вместо того, чтобы использовать цифры производителя.