Назад | Перейти на главную страницу

Если RAID5 / 6 опасен из-за URE, подвергаются ли риску и схемы полного резервного копирования / восстановления?

Насколько я понимаю, у вас есть высокая вероятность столкнуться с URE во время перестройки из-за необходимости читать большой объем данных для выполнения задачи.

Влияет ли эта проблема на сценарии резервного копирования и восстановления больших объемов данных? Если вам нужно выполнить полное восстановление из резервной копии 10 ТБ, URE кажутся столь же вероятными.

Настоящая проблема, связанная с URE и RAID5, заключается в том, что после запуска даже одного URE многие аппаратные контроллеры просто прерывают реконструкцию RAID и объявляют о смерти массива, помещая все ваши данные в автономном режиме. Хотя это «самая безопасная ставка» в отношении потенциального повреждения данных, это не всегда лучший вариант (например: подумайте о URE, влияющем на свободный / не выделенный файловой системой сектор данных. Хотя можно с уверенностью игнорировать аппаратный контроллер отключит весь массив).

RAID6 гораздо менее подвержен URE, поскольку избыточность двух дисков действительно снижает возможность одновременного использования URE в одном и том же секторе диска / LBA.

В то же время программный RAID (например, mdadm) обычно гораздо более гибкий, чем аппаратный RAID, что позволяет восстанавливать поврежденный массив RAID5 даже при обнаружении некоторых URE.

При восстановлении из резервной копии у вас обычно есть более гибкие инструменты; это означает, что в общем случае вы можете пропустить битые / нечитаемые сектора и продолжить восстановление других данных.

Все на томе находится под угрозой

Если вы заявляете, что у вас есть опасения относительно URE на томе / LUN, который пострадал из-за отказа диска RAID 5/6, тогда все данные на этом томе будут в опасности.

Убедитесь, что вы храните данные на томе / LUN, отличном от того, на котором хранится ваша резервная копия. Лучше всего указать, что ваша резервная копия находится на совершенно другом устройстве хранения, чем ваши производственные данные.

URE обычно находится на уровне блока, поэтому что-либо на этом томе может быть повреждено. Формат уровня блока находится на низком уровне в стеке. NTFS или VMFS (любой формат) идет на уровне блоков и так далее. Поскольку уровень блоков на томе RAID находится ниже всего, на все данные в нем влияют проблемы на уровне блоков.

Надеюсь, я правильно отвечу на ваш вопрос.

В принципе, да, но если вы храните резервную копию на RAID6 (например), у вас будет преимущество в виде избыточности, поэтому общая частота ошибок будет много ниже, а с ним и вероятность URE во время восстановления.

Если вы используете решение для резервного копирования на магнитную ленту, частота ошибок будет намного ниже (SAS: 1x10 ^ -15 - 1x10 ^ -16, LTO7: 1x10 ^ -19).