При условии SMART ненадежен для прогнозирования отказа жесткого диска, есть ли у кого-нибудь надежная альтернатива для автоматизации быстрой идентификации жестких дисков, которые начинают выходить из строя?
Это для Windows Server 2008 R2. Я не могу позволить себе роскошь использовать ReFS.
Моя основная забота - резервное копирование поврежденных данных в течение длительного периода времени, не зная, что они повреждены.
Используйте файловую систему, способную обнаруживать и исправлять повреждения, например ZFS, btrfs или Windows ReFS.
Жесткие диски могут умереть случайным образом и внезапно. SMART помогает определить тех, кто умирает медленно, но не тех, которые умирают быстро.
Когда «начало сбоить» и «полностью мертв» разделяют секунды, предупреждения нет.
Если вас беспокоит, что поврежденные данные останутся незамеченными, вам следует использовать аппаратное решение RAID с функцией типа патрулирования носителей, которая регулярно сканирует все диски в поисках всего поврежденного (для RAID5 / 6 он пересчитывает все контрольные суммы, чтобы убедиться, что они соответствуют тому, что должен быть там).
Вам также следует регулярно проверять свои резервные копии, чтобы убедиться, что они работают правильно. И храните не только последние, но и несколько более старых резервных копий на тот случай, если поврежденный или удаленный файл не обнаруживается в течение нескольких месяцев.