У меня есть новая установка CentOS 6.5 с двумя (подключенными к / mnt / data) дисками Western Digital Black емкостью 1 ТБ в raid 1 с mdadm, настроенными с помощью установщика. К сожалению, время от времени ядро всей системы вызывает панику со следом, подобным приведенному ниже:
Какие-нибудь советы по диагностике или исправлению этого? Очень признателен!
РЕДАКТИРОВАТЬ: Похоже, это произошло примерно в то же время, когда произошла проверка данных рейда: РЕДАКТИРОВАТЬ 2: последние два сбоя произошли незадолго до часа ночи воскресенья, в то же время происходит проверка данных.
Mar 23 01:00:02 beta kernel: md: data-check of RAID array md0
Mar 23 01:00:02 beta kernel: md: minimum _guaranteed_ speed: 1000 KB/sec/disk.
Mar 23 01:00:02 beta kernel: md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for data-check.
Mar 23 01:00:02 beta kernel: md: using 128k window, over a total of 976629568k.
/ proc / mdstat
Personalities : [raid1]
md0 : active raid1 sdc1[1] sdb1[0]
976629568 blocks super 1.1 [2/2] [UU]
bitmap: 0/8 pages [0KB], 65536KB chunk
unused devices: <none>
mdadm -D
/dev/md0:
Version : 1.1
Creation Time : Fri Mar 7 16:07:17 2014
Raid Level : raid1
Array Size : 976629568 (931.39 GiB 1000.07 GB)
Used Dev Size : 976629568 (931.39 GiB 1000.07 GB)
Raid Devices : 2
Total Devices : 2
Persistence : Superblock is persistent
Intent Bitmap : Internal
Update Time : Sun Mar 23 03:36:59 2014
State : active
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0
Name : beta.fmt2.spigot-servers.net:0 (local to host beta.fmt2.spigot-servers.net)
UUID : 89a86538:f6162473:d5e0524c:b80566d6
Events : 1728
Number Major Minor RaidDevice State
0 8 17 0 active sync /dev/sdb1
1 8 33 1 active sync /dev/sdc1
РЕДАКТИРОВАТЬ 3: Другой сбой, произошедший во время принудительной повторной синхронизации / проверки, также memtest прошел 4 прохода нормально: http://files.md-5.net/s/X3Hi.png
РЕДАКТИРОВАТЬ 4: Даже dd вызывает сбои: http://files.md-5.net/s/hba2.png
РЕДАКТИРОВАТЬ 5: SSD выдерживает испытание на пытки dd, думаю, это означает, что я собираюсь опробовать диски без рейда.
Это может указывать на состояние оборудования диска:
[root@ninja ~]$ /etc/rc.d/init.d/smartd start
[root@ninja ~]$ smartctl --all /dev/sdc | grep 'health'
SMART overall-health self-assessment test result: PASSED
[root@ninja ~]$ smartctl --all /dev/sdb | grep 'health'
SMART overall-health self-assessment test result: PASSED