Каков допустимый уровень жестких ошибок записи на ленту? В частности, что приемлемо для носителей HP LTO-2? Это точное количество ошибок, соотношение количества часов использования к ошибкам или что-то совсем другое?
Дальнейшая предыстория
Мы используем библиотеку MSL6000 с одним приводом LTO-2 с помощью Backup Exec 11d (на данный момент). Backup Exec всегда показывает некоторые программные ошибки для большинства дисков, но некоторые из них начинают показывать серьезные ошибки. Резервное копирование выполняется с немедленной проверкой, и проверка еще не завершилась неудачно, поэтому сейчас у меня нет причин для беспокойства.
Хотя я могу найти рабочий цикл для накопителя (250 000 часов), я не могу найти никаких точных цифр относительно того, когда конкретную ленту следует просто списать.
Если есть лучший способ ротации носителей, я тоже хотел бы это услышать. Мы также скоро перейдем на носитель LTO-4, поэтому мысли об ошибках там тоже будут полезны.
Отредактировано для добавления:
У меня нет серьезных ошибок на каждой ленте. Чтобы дать представление о том, на что я смотрю:
Tape Hours in Use Hard Errors
A 142 11
B 255 0
C 159 2
Подавляющее большинство моих лент похожи на B и C. A - исключение.
Я ищу здесь какой-то передовой опыт. Ленты подтверждают ОК. Я не хочу, чтобы лента выходила из строя только тогда, когда я хочу восстановить, но я также не хочу выбрасывать ленту с несколькими ошибками, если в этом нет необходимости.
Судя по моему опыту, эта частота ошибок все еще очень мала. Из спецификации LTO ECC:
ECC (код исправления ошибок), используемый LTO-Ultrium, достаточно мощный, чтобы гарантировать надежное восстановление данных даже при потере одной из восьми дорожек при операции чтения и повреждении до 1% байтов на оставшихся дорожках.
Для магазинов, в которых я работал, мы установили правила о том, сколько раз лента будет проходить через библиотеку, прежде чем мы будем очищать ее от ротации (обычно это было не менее 20 или 30 раз). Мы также восстанавливали образец лент один раз в квартал и проверяли md5sums на данных, чтобы убедиться, что вся система резервного копирования работает правильно.
Помимо количества ошибок, которое вы наблюдаете, существует ряд других переменных, некоторые из которых более важны для долговечности ленты:
Обычно это называется управлением жизненным циклом мультимедиа, и есть ряд компаний, которые на самом деле создают корпоративные программные пакеты для решения этой проблемы. Возможно, стоит изучить некоторые из них, чтобы узнать, есть ли идеи, которые вы найдете полезными в своем магазине. Один пример:
http://www.spectralogic.com/index.cfm?fuseaction=products.displayContent&CatID=1852