Через несколько дней я скопировал большой (56 ГБ) файл с рабочей станции на файловый сервер. После проверки копии я обнаружил, что она на несколько байтов отличается от оригинала.
Подробности:
Файл был скопирован перетаскиванием на рабочую станцию с локального диска в общую сетевую папку (на сервере). Размер файла 56886041991 байт.
Вторая копия, сделанная таким же образом днем позже, оказалась в порядке (проверено md5sum). Сравнение показывает, что есть 97 различающихся байтов. (см. ниже) Единственный паттерн, который я вижу, - это то, что битые байты сгруппированы в три группы, где каждый 128-й байт изменяется.
Что я могу сделать? С чего начать искать причину? Это не могут быть диски на сервере, так как они сообщат об ошибке чтения в случае повреждения, и даже если нет, ReFS не заметит неправильную контрольную сумму и не прочитает сектор с другого диска, и если он тоже поврежден, он будет (должен) сообщить об ошибке чтения. SATA имеет CRC. В RAM есть ECC. Сеть имеет 2 уровня контрольных сумм. На рабочей станции нет памяти ECC. Может глючит сетевой драйвер?
Выход cmp -l
: посмотреть здесь
Тем временем проведены дополнительные тесты:
md5sum /dev/sdX
в цикле: 5 раз выполняется на диске 5 ТБ, более 20 раз на других - ошибок не обнаруженоЯ думаю, это был одинокий космический луч ...