Назад | Перейти на главную страницу

Среднее время наработки на отказ - SSD

В Среднее время наработки на отказ, или MTBF, для этот SSD указан как 1,500,000 часов.

Это много часов. 1,500,000 часов примерно 170 лет. Поскольку изобретение этого конкретного SSD произошло после Гражданской войны, как они узнают, что такое MTBF?

Пара вариантов, которые мне понятны:

Вопрос:

Как рассчитывается среднее время наработки на отказ (MTFB) для SSD / HDD?

Производители дисков определяют надежность своих продуктов с помощью двух связанных показателей: годовой нормы отказов (AFR), которая представляет собой процент дисков в совокупности, которые не прошли тест, масштабированный до оценки за год; и средняя наработка на отказ (MTTF).

AFR нового продукта обычно оценивается на основе ускоренных ресурсных и стресс-тестов или на основе полевых данных для более ранних продуктов. MTTF оценивается как количество часов работы в часах в год, деленное на AFR. Распространенное предположение о том, что диски в серверах - это то, что они включены 100% времени.

http://www.cs.cmu.edu/~bianca/fast/

Среднее время наработки на отказ 1,5 миллиона часов звучит несколько правдоподобно.

Примерно это будет тест, при котором 1000 дисков работают в течение 6 месяцев и 3 диска выходят из строя.
AFR будет (2 * 6 месяцев * 3) / (1000 приводов) = 0,6% в год, а MTTF = 1 год / 0,6% = 1 460 967 часов или 167 лет.

Другой способ взглянуть на это число - когда у вас есть 167 дисков и вы оставляете их работать в течение года, производитель утверждает, что в среднем вы увидите сбой одного диска.

Но я ожидаю, что это просто постоянная "случайная" частота механических / электронных отказов.

Предполагая, что частота отказов соответствует изгиб ванны, как упоминалось в комментариях, маркетинговая команда производителя может немного изменить показатели надежности, например, не включая DOA (мертвые по прибытии, блоки, которые прошли контроль качества, но не проходят, когда их устанавливает конечный пользователь) и растягивая определение DOA чтобы также исключить тех, кто находится в пике раннего отказа. И поскольку тестирование проводится недостаточно долго, вы также не увидите возрастных эффектов.

думаю гарантийный срок - лучший показатель того, как долго производитель ожидает от SSD-накопителя!
Это точно не будет измеряться десятилетиями или столетиями ...


С MTBF связана надежность, связанная с конечным числом циклов записи, которые могут поддерживать ячейки NAND. Общей метрикой является общая емкость записи, обычно в ТБ. В дополнение к другим требованиям к производительности это еще один большой ограничитель.

Чтобы обеспечить более удобное сравнение между дисками разных производителей и разного размера, продолжительность записи часто преобразуется в суточную емкость записи как часть емкости диска.

Предполагая, что диск рассчитан на срок службы до тех пор, пока на него распространяется гарантия:
на твердотельный накопитель емкостью 100 ГБ может предоставляться гарантия 3 года, а на емкость записи 50 ТБ:

        50 TB
---------------------  = 0.46 drive per day write capacity.
3 * 365 days * 100 GB

Чем выше это число, тем больше подходит диск для операций ввода-вывода с интенсивной записью.
На данный момент (конец 2014 г.) SSD линейки серверов имеют значение 0,3-0,8 диска в день, средний диапазон неуклонно растет с 1-5, а высокопроизводительный, кажется, стремительно растет с уровнями выносливости записи до 25. * мощность накопителя в сутки за 3-5 лет.

Некоторые тесты в реальном мире показывают, что иногда заявления поставщиков могут быть значительно превышены, но вывод оборудования за пределы ограничений поставщика не всегда является соображением предприятия ... покупайте диски с правильными характеристиками для ваших целей.

К сожалению, MTBF - это не то, что думает большинство ...

  • Это не является как долго продлится индивидуальная поездка.

    Производители ожидают, что их диски прослужат столько же, сколько и гарантия, после чего это уже не их проблема. Старые жесткие диски с электромагнитными пластинами изнашиваются примерно через 10 лет. Интегральные схемы служат очень долго, но другие компоненты (особенно конденсаторы) изнашиваются после довольно предсказуемого количества циклов.

  • Это является сколько из этих дисков нужно ожидать, что 1 диск выходит из строя каждый час.

    Как указывали другие, производители проводят различные испытания в течение разумного периода времени и определяют частоту отказов. В такого рода тестах довольно много расхождений, и маркетинг часто вносит свой вклад в то, каким должно быть окончательное число. Независимо от того, они стараются изо всех сил угадать, сколько дисков потребуется в среднем на один сбой в час.

    Для ситуаций с меньшим количеством дисков вы можете сделать вывод о статистической вероятности отказа на основе MTBF, но имейте в виду, что отказы в хорошо спроектированных продуктах должны следовать кривая "ванна" - это более высокая частота отказов, когда устройства изначально вводятся в эксплуатацию и после истечения их гарантийного срока, с более низкой частотой отказов между ними.

Они исходят из статистической оценки, основанной на небольшом размере выборки и коротком промежутке времени. На самом деле не существует универсально согласованного метода или процесса, так что это просто глупый «маркетинг».

это статья может объяснить это немного подробнее. И Википедия есть формулы, которые могут быть тем, что вы ищете?

По сути, почти все (включая обычные бытовые машины, такие как посудомоечная машина) несколько продуктов используются в течение X времени. Сколько отказов произошло за этот период, используется для расчета MTFB.

Конечно, невозможно запускать продукты на протяжении всего жизненного цикла, то есть твердотельные накопители, которые прослужат долгое время. В основном они ограничиваются количеством записей, а не механическими отказами (для чего и предназначена MTFB)

Плохая новость о MTBF заключается в том, что общие методы оценки предполагают равномерно распределенную нагрузку записи между всеми ячейками NAND. Но ячейки сгруппированы в кластеры, и при выходе из строя одной ячейки - весь кластер помечается как мертвый и заменяется новым из резерва. Обычно резерв составляет около 20% от объема SSD. Когда резерв исчерпан, весь SSD будет помечен как мертвый.

IRL SSD содержит как постоянные, так и изменчивые данные. Представьте, что у вас 90% SSD заполнено статическими данными, а остальные 10% находятся под большой нагрузкой записи. Контроллер SSD распределяет нагрузку между доступными свободными кластерами. Эти 10% истощают свою жизнь в 10 раз быстрее, чем вы предполагали. Они будут заменяться из резерва снова и снова до конца.

В действительно плохом случае, когда объем постоянных / изменчивых данных составляет 30: 1 или больше, например - куча фотографий и относительно небольшая база данных для популярного веб-сайта, ваш SSD умрет через год.

Один из моих клиентов был очень впечатлен характеристиками SSD и настоял на том, чтобы оборудовать его СУБД-сервер парой из них. В последующие 12 месяцев мы заменили их дважды.

Но, судя по маркетинговым материалам, срок службы SSD составляет 170 лет. Конечно.

Среднее время безотказной работы не имеет отношения к измерению срока службы SSD-накопителя, поскольку SSD не чувствителен к самому времени, как обычный вращающийся жесткий диск, но к количеству перезаписей для ячеек SSD. Больше актуальным показателем для SSD является число операций записи на диск в день (DWPD).. Например, для некоторых SSD-дисков корпоративного класса сроком службы 3,2 ТБ будет 3 DWPD в течение 5 лет.

Иногда поставщик SSD предоставляет ресурс в виде (общего) записанных терабайт (TBW) или «циклов записи», которые можно легко преобразовать в DWPD и наоборот, зная время и максимальную пропускную способность для данного SSD-диска.

Для данного примера с SSD-накопителем 3,2 Тб:
TBW = Размер диска * Годы * DWPD;
TBW = 3,2 ТБ * 5 * 365 * 3d = 17520 ТБ на 5 лет

Если диск обеспечивает стабильную пропускную способность записи 80 МБ в секунду, то
WriteCycles = DWPD * Годы;
WriteCycles = 3 * 365 * 5 = 5475 полных циклов записи для данного диска

Важно отметить, что мы рассчитываем наихудший случай, если вы обеспечите 100% загрузку диска (что, скорее всего, невозможно).