У меня есть Supermicro Server с RAID-контроллером LSI MegaRAID SAS 9261-8i внутри. К контроллеру было подключено 3 диска, которые были настроены как массив RAID5. Один из дисков недавно вышел из строя (RAID отображается как поврежденный), и после проверки информации S.M.A.R.T выяснилось, что его необходимо заменить.
Я пометил диск как отсутствующий с помощью storcli и удалил диск для отправки поставщику. Теперь пришла замена для диска, я подключил его к контроллеру RAID, но ничего не случилось. Вот что говорит Сторчли:
storcli /c0 show
TOPOLOGY :
========
------------------------------------------------------------------------
DG Arr Row EID:Slot DID Type State BT Size PDC PI SED DS3 FSpace
------------------------------------------------------------------------
0 - - - - RAID5 Dgrd N 5.456 TB dflt N N none Y
0 0 - - - RAID5 Dgrd N 5.456 TB dflt N N none Y
0 0 0 - - DRIVE Msng - 2.728 TB - - - - -
0 0 1 252:5 14 DRIVE Onln N 2.728 TB dflt N N none -
0 0 2 252:2 11 DRIVE Onln N 2.728 TB dflt N N none -
------------------------------------------------------------------------
Как видите, оба диска в слотах 2 и 5 подключены к сети, а другой диск из группы устройств (DG) помечен как отсутствующий. Третий диск раньше находился в слоте 0, в то время как замена теперь находится в слоте 1. Но новый диск не распознается контроллером, как вы также можете видеть в списке физических устройств (вывод той же команды, что и выше):
Physical Drives = 2
PD LIST :
=======
-----------------------------------------------------------------------------
EID:Slt DID State DG Size Intf Med SED PI SeSz Model Sp
-----------------------------------------------------------------------------
252:2 11 Onln 0 2.728 TB SATA HDD N N 512B WDC WD3000FYYZ-01UL1B0 U
252:5 14 Onln 0 2.728 TB SATA HDD N N 512B WDC WD3000FYYZ-01UL1B0 U
-----------------------------------------------------------------------------
В отличие от этого, посмотрите следующий вывод:
storcli /c0/pall show
PhyInfo :
=======
----------------------------------------------------------------------------
PhyNo SAS_Addr Phy_Identifier Link_Speed Device_Type Description
----------------------------------------------------------------------------
0 0x0000000000000000 0 No limit - -
1 0x4433221101000000 0 No limit End Device -
2 0x0000000000000000 0 No limit - -
3 0x0000000000000000 0 No limit - -
4 0x4433221104000000 0 No limit End Device -
5 0x0000000000000000 0 No limit - -
6 0x4433221106000000 0 No limit End Device -
7 0x0000000000000000 0 No limit - -
----------------------------------------------------------------------------
я думаю что PhyNo 1
- это замененный диск, но это единственная команда, по которой я могу найти его след. Все команды для конкретных слотов для Slot 1
заканчивается Drive not found
.
Есть идеи по этому поводу? Я протестировал замененный диск на втором сервере, который имеет точно такую же настройку (также тот же RAID-контроллер), где контроллер обнаруживает диск, мгновенно помеченный как UGood
что значит Unconfigured Good
, значит, это не может быть ошибка диска. Я также сделал несколько перезагрузок, выключился на несколько минут и попытался использовать LSI MegaRaid BIOS при загрузке для обнаружения нового диска, но безуспешно. Диск не отображается в сообщении загрузки LSI MegaRaid BIOS.
Будем очень признательны за любые подсказки.
Как выясняется, такое поведение было вызвано голодный HDD - который был заменен. Я не понял, потому что второй сервер без проблем распознал новый жесткий диск, но, возможно, это был последний вздох этого девственного жесткого диска.
Я не ожидал дефект по прибытии жесткими дисками уровня центра обработки данных (серия WD RE, прежде чем вы спросите), я узнаю об этом в будущем, прежде чем я буду тратить часы своего времени.