У меня есть несколько серверов Debian в центре обработки данных, и время от времени я замечаю, что программный RAID 1 ухудшился. Хотя процесс повторной синхронизации запускается автоматически, и я не теряю никаких данных, я нахожу это раздражающим, поскольку он замедляет работу серверов даже на несколько дней, пока выполняется повторная синхронизация жестких дисков.
Мне было интересно, что именно вызывает десинхронизацию жестких дисков в первую очередь и есть ли какие-либо параметры конфигурации, чтобы этого не произошло.
Будем очень признательны за любые мысли / предложения по этому поводу.
Вы также можете проверить наличие cron
задание, которое регулярно запускает проверку RAID на зеркалах. Это может выглядеть много как повторная синхронизация, пока это происходит.
В системах типа CentOS это делается /etc/cron.weekly/99-raid-check
; Однако я не знаю, что это было бы в системе Debian.
редактировать: Это еженедельное задание cron, которое запускает проверку RAID, в результате чего диски выполняют что-то очень похожее на повторную синхронизацию RAID. Это не то же самое, что просто проверить, не отказал ли RAID; основная линия echo "check" > /sys/block/$dev/md/sync_action
. Если вы говорите, что постоянно обнаруживаете, что ваши RAID-массивы повторно синхронизируются, возможно, именно это вас укусит. Если вы говорите, что они постоянно сообщают о неизлечимых деградациях, это не то.
Если вы думаете, что это могло быть так, вам придется посмотреть, где Debian выполняет еженедельные / ежемесячные задания cron.
Редактировать 2: этот файл в /sys
это не настоящий файл, это артефакт ядра. Вы должны выяснить, какие cron
работа пишет check
в этот файл и остановите его. Извините, но у меня мало опыта работы с debian, и я не знаю, где он хранит свои системные файлы cron. Но если вы будете копаться, то сможете найти местный эквивалент моего /etc/cron.weekly/99-raid-check
, и отредактируйте его (или файл ресурсов, от которого он зависит), чтобы он этого не делал, или просто удалите его.
Редактировать 3: вы можете попробовать
echo idle > /sys/block/md0/md/sync_action
чтобы остановить текущую проверку синхронизации. Но прошло много времени с тех пор, как мне пришлось отключить одну промежуточную проверку, поэтому я не могу на это поклясться.