Назад | Перейти на главную страницу

Может ли неисправный SSD привести к перезапуску сервера?

Один из наших серверов столкнулся со случайным перезапуском по времени, мы попросили DC запустить тест оборудования, и они сказали, что один из SSD, вероятно, вышел из строя. Может ли это быть причиной перезапусков в случайное время?

Мы завершили тестирование системы и показываем, что SDD выдает признаки отказа, о чем свидетельствует следующее:

Модель устройства: Samsung SSD 840 EVO 500GB Серийный номер:
S1DHNSAF218733W ID # ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 5 Reallocated_Sector_Ct 0x0033 098 098 010 Pre-fail Всегда
- 135 9 Power_On_Hours 0x0032 087 087 000 Old_age Всегда - 62573 12 Power_Cycle_Count 0x0032 099 099 000 Old_age Всегда - 109 177 Wear_Leveling_Count 0x0013 001001 000 Pre-fail Always
- 1806 179 Used_Rsvd_Blk_Cnt_Tot 0x0013 0980 098010 Всегда до отказа - 135 181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0 182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Всегда
- 0 183 Runtime_Bad_Block 0x0013 098 098 010 Pre-fail Always - 135 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0032 065 052 000 Old_age Всегда
- 35195 Hardware_ECC_Recovered 0x001a 200200000 Old_age Всегда - 0199 UDMA_CRC_Error_Count 0x003e
100 100 000 Old_age Всегда - 0 235 Unknown_Attribute 0x0012 099 099 000 Old_age Всегда
- 107 241 Total_LBAs_Written 0x0032 099 099 000 Old_age Всегда - 269296231666

Скорее всего, это вызывает перезагрузку системы.

Вы не упомянули, как вы управляете приводом SDD. Если у вас есть несколько SSD-накопителей и они работают в режиме RAID (1+), один отказавший накопитель не приведет к перезагрузке сервера - это повлияет на производительность, но не на стабильность.

В любом случае, как только вы обнаружите неисправное устройство, рекомендуется заменить его. Это может быть критичным, но даже оно избыточно, что снижает избыточность, приближающую вас к отказу.

Да, аппаратный сбой может вызвать перезагрузку, отказ диска критичен и должен быть исправлен.