Вчера я получил отчет об ошибках SSD ATA на одном из моих хостов.
SSD-диск имеет размер 128 МБ OCZ-VERTEX4 Firmware rev 1.3 около 8 месяцев.
ОС - Ubuntu 11.04 с ядром 2.6.38-16-generic.
Материнская плата - Intel DP35DP.
Нет никаких ошибок чтения или каких-либо других ошибок диска, поскольку эти две ниже.
Должен ли я подготовить сменный диск?
Умные атрибуты:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x0000 --- --- --- Old_age Offline - 393222
3 Spin_Up_Time 0x0000 100 100 000 Old_age Offline - 0
4 Start_Stop_Count 0x0000 100 100 000 Old_age Offline - 0
5 Reallocated_Sector_Ct 0x0000 100 100 000 Old_age Offline - 0
9 Power_On_Hours 0x0000 --- --- --- Old_age Offline - 507536484
12 Power_Cycle_Count 0x0000 --- --- --- Old_age Offline - 1664100
232 Available_Reservd_Space 0x0000 100 100 000 Old_age Offline - 4804710657
233 Media_Wearout_Indicator 0x0000 099 000 000 Old_age Offline - 99
Журнал ядра:
Jun 1 11:50:42 kernel: [424453.095411] ata4: exception Emask 0x10 SAct 0x0 SErr 0x4010000 action 0xe frozen
Jun 1 11:50:42 kernel: [424453.095415] ata4: irq_stat 0x00400040, connection status changed
Jun 1 11:50:42 kernel: [424453.095418] ata4: SError: { PHYRdyChg DevExch }
Jun 1 11:50:42 kernel: [424453.095422] ata4: hard resetting link
Jun 1 11:50:42 kernel: [424453.840022] ata4: SATA link down (SStatus 0 SControl 300)
Jun 1 11:50:44 kernel: [424455.948532] ata4: hard resetting link
Jun 1 11:50:45 kernel: [424456.490021] ata4: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Jun 1 11:50:45 kernel: [424456.490288] ata4.00: configured for UDMA/133
Jun 1 11:50:45 kernel: [424456.490294] ata4: EH complete
Jun 1 19:18:23 kernel: [451311.319525] ata4.00: exception Emask 0x10 SAct 0x0 SErr 0x4010000 action 0xe frozen
Jun 1 19:18:23 kernel: [451311.319529] ata4.00: irq_stat 0x00400040, connection status changed
Jun 1 19:18:23 kernel: [451311.319532] ata4: SError: { PHYRdyChg DevExch }
Jun 1 19:18:23 kernel: [451311.319535] ata4.00: failed command: FLUSH CACHE
Jun 1 19:18:23 kernel: [451311.319541] ata4.00: cmd e7/00:00:00:00:00/00:00:00:00:00/a0 tag 0
Jun 1 19:18:23 kernel: [451311.319542] res 40/00:0c:78:c6:c7/00:00:0a:00:00/40 Emask 0x10 (ATA bus error)
Jun 1 19:18:23 kernel: [451311.319545] ata4.00: status: { DRDY }
Jun 1 19:18:23 kernel: [451311.319549] ata4: hard resetting link
Jun 1 19:18:23 kernel: [451312.060033] ata4: SATA link down (SStatus 0 SControl 300)
Jun 1 19:18:23 kernel: [451314.082062] ata4: hard resetting link
Jun 1 19:18:23 kernel: [451314.630022] ata4: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Jun 1 19:18:23 kernel: [451314.630295] ata4.00: configured for UDMA/133
Jun 1 19:18:23 kernel: [451314.630298] ata4.00: retrying FLUSH 0xe7 Emask 0x10
Jun 1 19:18:23 kernel: [451314.630320] ata4: EH complete
Возможно, неисправен кабель, но также возможно, что прошивка накопителя плохая. Это также может (очень редко) происходить разово. Эта ошибка появляется, когда диск не отвечает на команды ATA или когда данные не передаются должным образом через соединение.
Подумайте о замене кабеля и проверьте наличие обновлений прошивки (и если вы не делаете резервные копии, вчера - прекрасное время для начала). Если вы видите, что это происходит снова или чаще, вам необходимо заменить диск.
Очень редко это также может быть плохой контроллер IDE (на карте RAID или материнской плате).
У меня было то же самое с моим старым Vertex, и после неудачной команды CACHE FLUSH диск отключился до отключения и включения питания. Это было повторяемо. Похоже, это была ошибка в прошивке накопителя, и защитное стирание вернуло накопитель в рабочее состояние.