Сегодня утром отказал диск на нашем сервере базы данных. Массив дисков (3 диска) настроен в конфигурации RAID 5.
Пока мы ждем замены диска, мы готовимся к стратегии восстановления. Пользователи продолжают работать с системой, хотя и очень медленно (не знаю почему ??).
Как установить новый диск - будут ли данные для этого диска автоматически восстановлены с учетом четности или есть другой процесс, которому мы должны следовать?
Редактировать: Это аппаратный RAID-контроллер. (Спасибо за ответы, благодарю)
Система работает очень медленно, потому что ей приходится восстанавливать недостающие данные, что требует дополнительного процессора и ввода-вывода.
Если у вас отсутствует диск в конфигурации RAID-5, у вас есть нет стратегии восстановления. Если другой диск выходит из строя вы потеряете свои данные. Бегите, а не ходите, к ближайшему поставщику, у которого вы можете получить совместимую деталь, на которую распространяется гарантия производителя, и доставить ее срочным курьером в тот же день. Если поставщик, у которого вы купили массив, уже получает деталь, возьмите обе детали и спрячьте другую в качестве запасной.
Если у вас есть RAID-5, который используется для производственной системы, вам следует подумать о том, чтобы оставить в массиве запасной диск в качестве «горячего» резерва.
Добавлено - если ваши журналы не находятся на отдельном томе (физически на отдельных дисках), переместите их на отдельный набор дисков, даже на одну зеркальную пару. Это также приведет к выигрышу в производительности, если ваша база данных имеет значительную нагрузку, так как конкуренция за тома журналов непропорционально плохо влияет на производительность.
Если это возможно, вы также можете сделать свою базу данных более надежной, выполнив следующие действия:
Если у вас есть журналы на отдельном томе, вы можете восстановить и выполнить откат из резервной копии если и только если сбой диска не нарушает журналы. Журналы базы данных должны находиться на отдельном томе диска (среди прочего) по следующим причинам:
Шаблоны использования журналов преимущественно последовательны, добавляя записи журнала в конец файла (файл фактически является кольцевым буфером). Это означает, что большое количество записей журнала может быть быстро записано, так как активность поиска головки на диске незначительна.
Если они совместно используют физические диски с большой рабочей нагрузкой произвольного доступа (например, транзакционные таблицы и индексы), они будут непропорционально замедлены, поскольку активность поиска головки нарушает последовательные записи.
Размещение журналов на отдельном томе почти всегда дает выигрыш в производительности, и для поддержки довольно тяжелых рабочих нагрузок требуется только одна зеркальная пара для журналов. Это означает, что оборудование для этого довольно дешево, поэтому есть небольшая стоимость за большую производительность и надежность.
Если ваш массив данных выйдет из строя, журналы не потеряны. Если у вас есть правильная стратегия резервного копирования, вы можете восстановить данные из резервной копии и продолжить работу по журналам. Это означает, что весь массив может выйти из строя на сервере, не создавая единой точки отказа. И журнал, и массивы данных должны выйти из строя одновременно, чтобы вызвать потерю данных.
1) Бэкап.
На данный момент данные не потеряны. Если ваши резервные копии не обновлены, сделайте резервную копию сейчас.
2) Прочтите руководство, позвоните поставщику и т. Д.
В разных системах RAID есть разные шаги для замены диска, и, сделав ошибку, вы рискуете уничтожить весь массив. Не зная, какое у вас оборудование / программное обеспечение RAID, мы можем только догадываться о необходимых шагах.
Кроме того, низкая производительность связана с тем, что RAID 5 в ухудшенном состоянии (например, один диск мертв) имеет ужасную производительность чтения. Насколько ужасно, зависит от того, как хранится четность и какой диск умер, но "хорошая" новость заключается в том, что низкая производительность при отсутствии одного диска - это известная проблема, а не повод для паники.
Сначала я бы прочитал руководство для оборудования / программного обеспечения, которое вы используете - раздел для восстановления после сбоя :)
Однако должно быть несложно заменить диск и перестроить массив.
Самым важным моментом в таких случаях является то, что диск следует заменить как можно скорее, поскольку при выходе из строя другого диска вы, вероятно, потеряете данные. Также вы должны устранить причину сбоя - был ли это устаревший диск? Стоит ли заменить и другие? Или это из-за скачка напряжения, тепла или вибрации?
Насколько я понимаю, RAID5, когда вы заменяете неисправный диск, он автоматически восстанавливается на основе информации, хранящейся на двух других. Возможность «горячей замены» нового диска зависит от вашей системы - возможно, сначала вам придется выключить питание. В любом случае, учитывая относительно низкую стоимость дисков и важность ваших данных (что отражено вашим решением использовать RAID5 в первую очередь), вам действительно нужно иметь запасной диск, сидящий в ящике, готовый к такой возможности. .
Недавно я построил для себя новый компьютер для разработки и настроил основные диски с данными в RAID5. Я заказал на один диск больше, чем необходимо, так что у меня есть запасной на случай чрезвычайной ситуации (надеюсь, этого не произойдет)
Теперь вы задали вопрос, я полагаю, мне лучше почитать на эту тему еще раз.
Полностью зависит от системы. Что написано в инструкциях? Полностью ли ваше оборудование поддерживает горячее подключение новых дисков от контроллера к отсеку для дисков? У вас есть недавние резервные копии?
Сообщение NXC хорошо подводит итог. На всякий случай, если вы не замените неисправный диск до того, как второй выйдет из строя, все еще есть хороший шанс восстановить почти все (иногда все) специализированной службой восстановления. Данные все еще находятся на дисках, и неисправный диск обычно можно вернуть к жизни в специализированной лаборатории с соответствующим оборудованием. Однако цена на эту услугу довольно высока. Наличие запасного диска и надлежащих резервных копий (согласно предложению NXC) - определенно лучший путь в будущем.