У меня есть сервер с RAID-контроллером Adaptec 6405 и 4 дисками в конфигурации RAID 5. Сотрудники центра обработки данных позвонили мне, потому что заметили, что в одном из отсеков для дисков загорелся красный светодиод.
Затем я проверил статус с помощью arcconf getconfig 1 и получил сообщение о статусе «Логические устройства / Сбой / Деградировано: 2/0/1».
Состояние логических устройств было указано как «Восстановление». Однако я не получил никакого подозрительного статуса затронутого физического устройства, S.M.A.R.T. установка была "нет", S.M.A.R.T. предупреждения были равны «0», а также «arcconf getsmartstatus 1» не вернул никаких проблем ни с одним из дисководов.
Команда arcconf getlogs 1 events tabular дает много результатов (извините, я не могу вставить сюда файл журнала, так как у меня есть только удаленный доступ к консоли, но я мог бы опубликовать снимок экрана). Вот несколько примеров записей:
eventtype FSA_EM_EXPANDED_EVENT
grouptype FSA_EXE_SCSI_GROUP
subtype FSA_EXE_SCSI_SENSE_DATA
subtypecode 12
cdb 28 00 17 c4 74 00 00 02 00 00 00 00
data 70 00 06 00 00 00 00 00 00 00 00 00 02 00 00 00 00 00 00 00 00 00 00 00 00 0
Команда arcconf getlogs 1 device tabular сообщает об ошибках mediumErrors 1 для двух дисков.
Сегодня я еще раз проверил состояние контроллера. Все вернулось в норму, статус контроллера теперь «Логические устройства / Сбой / Ухудшение: 2/0/0», все логические устройства также вернулись к «Оптимальному». Мне не удалось проверить состояние светодиода, я предполагаю, что красный светодиод снова не горит.
Теперь у меня много вопросов:
Пожалуйста, посоветуйте, вся помощь очень ценится.
какова возможная причина средней ошибки, почему она также не отображается в журнале SMART?
МОЖЕТ ли быть ошибкой, не связанной с умом? В зависимости от кабелей несовместимость с SAS.
Стоит ли заменять диски? Их купили всего месяц назад
Ой, ты спрашиваешь? Сейчас на них действует полная гарантия - что вы получите, если НЕ замените их и дождитесь истечения срока гарантии?
Процесс восстановления занял один или два дня, это нормально? Диски по 2 ТБ каждый, и система хранения в основном простаивает.
Ну да. Будьте счастливы, что это сработало. Смотрите, RAID 5, диски 23 ТБ = без защиты, RAID 5 начинает выходить из строя более 1 ТБ. Добро пожаловать в мир боли - если вы цените свои данные, лучше добавьте Raid 6.
Да, это большие медленные диски, на восстановление которых уходит много времени.
метка времени журналов, кажется, показывает момент извлечения журнала, а не момент инцидента.
Возможно.