У нас есть 4 тома EBS по 100 ГБ, используемые в качестве динамических дисков в накопителе raid 0 (с чередованием), подключенном к 64-битному экземпляру Amazon EC2 с Windows2008 R2 Datacentre.
Все это работает нормально, за исключением того, что у нас было 3 случая в течение 5 недель, когда один из дисков внезапно становился нечитаемым / недоступным, и он отключен в диспетчере дисков, и вы не можете повторно активировать его обратно на чередующийся диск с помощью диспетчера дисков.
Единственный способ заставить его снова работать - это перезапустить экземпляр Windows EC2. После повторной загрузки все диски / тома чередующегося диска снова подключатся к сети.
Amazon еще не смогла ответить за нас, и мне было интересно, сталкивался ли кто-нибудь еще с такой же проблемой или имел решение?
Если каждый раз это один и тот же диск, я могу сказать, что у меня тоже была эта проблема раньше. Насколько я могу судить, сервер, на котором размещен такой объем, может быть либо медленным, либо нестабильным. Вы можете попробовать создать второй raid0, скопировав все данные и разрушив первый. Это грубая сила, но эффективная.
Другой вариант - воссоздать с помощью raid5. Это будет медленнее, но, по крайней мере, вы не будете отключены из-за отсутствия одного диска, и гораздо проще восстановить с новым томом, когда система все еще активна (хотя и с ухудшенным raid5).
Наше решение состоит в том, чтобы иметь первичный и вторичный серверы, где, если первичный выйдет из строя, мы сможем переключиться. Обычно через некоторое время проблемная система устраняется, и исходная система снова становится пригодной для использования.