Сегодня я получил это довольно приятное письмо, в котором говорится, что один из дисков в массиве RAID1 вышел из строя.
A Fail event had been detected on md device /dev/md4.
It could be related to component device /dev/sdc2.
Faithfully yours, etc.
P.S. The /proc/mdstat file currently contains the following:
Personalities : [raid1] md4 : active raid1 sdd2[1] sdc2[2](F)
87667136 blocks [2/1] [_U]
md3 : active raid1 sdd1[1] sdc1[0]
250304 blocks [2/2] [UU]
Странно то, что sdc2 - это всего лишь один раздел, а другой раздел не вышел из строя.
Поскольку сервер в другой стране, физически осмотреть его не могу. Есть предложения, как проверить, действительно ли это сбой или сбой?
Если ваш хард умный: smartctl -t long /dev/sdc
и через час-два: smartctl -a /dev/sdc
и посмотрите, сообщает ли он об ошибках.
Повторно добавьте раздел и посмотрите, не появится ли ошибка снова. Если это так, ваш диск начинает выходить из строя.