Назад | Перейти на главную страницу

MEGARAID RAID 1 SSD С ДОСТУПНЫМ ГОРЯЧИМ ЗАПАСОМ

Я не знаю, требует ли это немедленных действий или нет. Сервер W2012R2 с двумя твердотельными накопителями емкостью 500 ГБ плюс один идентичный Hot Global Spare. RAID - это Megaraid. Снимки экрана из утилиты RAID прилагаются ниже. Это бизнес в маленьком городке, где у нас нет простого доступа к профессионалам в области оборудования. Я разработчик программного обеспечения, так что я все, что у нас есть.

В конфигурации есть отдельный диск емкостью 1 ТБ, который используется для «временного» хранилища и не требует зеркального копирования или резервного копирования. Затем три твердотельных накопителя Samsung емкостью 500 ГБ, два зеркальных и один настроенный как глобальный горячий резерв.

Мы начали видеть, что выглядит как дисковые ошибки в журнале, показанном ниже. Моя цель состояла в том, чтобы определить, какой из дисков вышел из строя, и заменить его Hot Spare, который был изначально установлен для такого типа ситуаций.

Эти диски работают без происшествий около 3,5 лет в режиме 24/7.

Итак, мои вопросы:

  1. Учитывая, что это первое свидетельство какой-либо проблемы с диском, и тот факт, что программное обеспечение указывает состояние как «оптимальный», нужно ли мне немедленно заменить? Это SSD, ожидаю ли я, что он выйдет из строя, как вращающийся диск, то есть быстро станет хуже? Или в качестве SSD возможен отказ от возможного отказа?

  2. Учитывая, что мне нужно заменить сейчас, я не знаю, как подойти к этому с помощью этого программного обеспечения наиболее простым способом. Интуитивно я могу определить, какой из дисков выходит из строя, но сообщение, похоже, не передает никакой информации такого рода. Затем добавьте в массив Hot Spare и удалите неисправный диск.

3 (а). Как определить, какой из существующих дисков является проблемным?

3 (б). Как удалить неисправный диск из массива и заменить его горячим резервом для восстановления?

3 (в). Можно ли все это сделать из утилиты Windows или нужно сделать это с экрана настроек RAID при загрузке? Эта утилита ВИДИТ для поддержки этих операций.

Я буду глубоко признателен за любой вклад по этой проблеме. Я пытаюсь разобраться с этим до того, как мы начнем терять данные или иметь простои, но я обнаружил, что первоначальное включение массива несколько лет назад было более простой проблемой, чем замена потенциально неисправного диска.

Заранее спасибо.

Что в деталях SMART говорится о поврежденных секторах и ошибках чтения? А как насчет оставшегося срока службы в%? В общем, если диски по-прежнему отображаются как Оптимальные, вы можете безопасно продолжать их использовать (я даже все еще использую один на ежедневной основе, который два года назад показывался как "ПЛОХОЕ состояние" без проблем, хотя я бы не рекомендовал его для важных данных и, конечно, не в бизнес-среде), хотя это зависит от машины.

Поскольку у вас есть диск с горячим резервом (то есть, если он действительно настроен как диск с горячим резервом!), Он автоматически заменит неисправный диск (поэтому он называется Горячий запасной), как только он понадобится. Обычно здесь не нужно вмешиваться вручную. Убедитесь, что ваши резервные копии в порядке: недавние, достаточно долгая и проверенные на наличие повреждений.

Некоторые другие мысли:

Какой у вас бюджет? Если у вас есть бюджет, купите дополнительный диск на всякий случай. Для большей надежности убедитесь, что это та же модель. Если вы это сделаете, проверьте свою гарантию на текущую, которая показывает ошибки, и замените ее. Если это достойная марка и модель SSD, у вас, вероятно, есть как минимум 5-летняя гарантия (если не превышен максимальный TBW). Если у вас большой бюджет, купите больше одного.

Насколько важно время безотказной работы? Если простои совершенно неприемлемы, вам следует инвестировать в высокую доступность вашего хранилища, то есть в запасную систему хранения на случай, если у вас упадет ток. Облачное хранилище резервных копий - это один из вариантов, но для этого вам понадобится хорошее подключение к Интернету. Другой вариант - дополнительный NAS. Если бюджет ограничен, подержанная система также является достойным вариантом в качестве резервного плана для сокращения времени простоя.

Что касается технической поддержки оборудования, есть и удаленные варианты. Не пытайтесь делать что-то слишком быстро в одиночку, потому что есть вероятность, что вы все испортите и вызовете простои компании.

Я не знаком с Megaraid, но программного обеспечения вашего рейд-контроллера должно быть достаточно, чтобы заменить неисправный диск или изменить настройки вашего рейда.