Два из четырех моих серверов в настоящее время имеют mismatch_cnt
около 40000 и это меня беспокоит. Мы используем настройку RAID10. В руководстве указано, что
Однако на RAID1 и RAID10 проблемы с программным обеспечением могут вызывать несоответствие. Это не обязательно означает, что данные в массиве повреждены. Возможно, системе просто все равно, что хранится в этой части массива - это неиспользуемое пространство.
Мы не используем файлы подкачки на наших серверах. На одном из жестких дисков сервера произошел сбой самопроверки SMART, а значение Available_Reservd_Space слишком мало. Хостинг-провайдер утверждает, что заменяет жесткие диски только тогда, когда они физически неисправны.
Я думаю, что не понимаю истинного значения и полезности этого параметра. Какие еще могут быть причины такого большого значения этого параметра? Как могло случиться так, что система не заботится о том, что находится в этой части массива, если она является зеркальной? Я думаю, из соображений безопасности система должна синхронизировать свободное пространство, а затем - что осталось?
Есть ли надежные способы оценить риск наличия конкретного жесткого диска на сервере?
Часто для высокого mismatch_cnt
на массиве RAID1 / 10:
Вышеуказанная причина безвредна: пока они делать указывают на различия в массиве (в основном, несинхронизированном массиве), они примерно неиспользованный дисковое пространство.
Однако есть гораздо более опасный и опасный mismatch_cnt
Причина: проблема с оборудованием (например, неисправный источник питания, обеспечивающий непостоянное питание и / или некорректно функционирующий чип DRAM диска) может изменить данные в полете, что приведет к множеству несоответствий между двумя дисками.
Вы можете найти больше информации на эта тема в списке рассылки linux-raid.