Я относительно новый (и единственный) системный администратор в своей организации. У нас есть HP ProLiant DL380p Gen8 Сервер, с которым больше не заключен какой-либо контракт на поддержку от HP. Мы используем его как хост Hyper-V для 4 виртуальных серверов. Сам виртуальный хост не копируется, но виртуальные серверы, работающие на нем, копируются в Azure. (Нам нужно, чтобы физический сервер прослужил еще несколько месяцев, пока я не перенесу последний оставшийся сервер приложений в облако и переключу всех наших пользователей / машины на Azure AD из локальной AD). RAID-контроллер сервера - это Контроллер Smart Array P420i.
Вчера один из дисков емкостью 300 ГБ в массиве RAID 5 сервера (всего в массиве три диска) начал попеременно мигать зеленым и желтым цветом. Согласно стр. 102 руководство и интерфейс iLO сервера, этот диск находится в состоянии «Degraded (Predictive failure)».
Это буквально мой первый раз замена диска RAID на производственном сервере, и я хочу убедиться, что не облажался. Как единственный администратор, мне не к кому обратиться за помощью.
Нужно ли мне ждать, пока диск действительно выйдет из строя, прежде чем заменять его? Или я могу заменить его сейчас, предварительно?
Можно ли просто заменить диск в горячем режиме (например, нажать кнопку извлечения, вытащить его и вставить новый диск)? Будет ли RAID-массив автоматически восстанавливаться, или мне нужно сообщить контроллеру / Windows о существовании нового диска?
Есть ли риск / польза от холодной замены диска? Технически серверу не нужно оставаться включенным в нерабочее время, поэтому я могу остаться, чтобы заменить его в холодном режиме. НО, этот ответ говорит, что существует опасность холодной замены и «что это нужно делать во время работы системы» ... Это более старая модель сервера, но я не понимаю, почему может возникнуть проблема с холодной заменой.
Я читал о сбоях дополнительных дисков при попытке восстановить массив RAID 5. Поскольку технически этот диск не является неисправным, а только «предсказуемо выйдет из строя», это каким-либо образом снижает вероятность отказа другого диска (поскольку, если они скоро выйдут из строя, они будут в том же состоянии, что и этот, и не в здоровом состоянии)? Это больше для моего душевного спокойствия, лол ...
Спасибо за вашу помощь!
Нет, лучше замените его как можно скорее. Поскольку другой диск может выйти из строя, лучше всего сделать это как можно раньше.
Да, это можно заменить. На самом хосте, так как это Hyper-V в Windows, если у вас установлена утилита raid, вы можете увидеть состояние RAID. Вы можете выполнить восстановление оттуда, чтобы предотвратить перезапуск.
Нет, но я бы сделал это, пока сервер работает.
Да, поскольку когда будет вставлен новый диск, перестройка создаст дополнительную нагрузку на оставшийся диск, поэтому лучше сделать это как можно раньше. Идея в том, что если один диск выйдет из строя, другой может выйти из строя слишком рано. Чтобы проиллюстрировать это, это похоже на автомобильную шину, у них такой же износ нити, поэтому по логике может скоро выйти из строя, как уже чувствуется.