У меня есть установка CentOS 6.0 на виртуальной машине Hyper-V. Я пробую некоторые функции программного RAID в Linux, и у меня есть массив RAID-5, состоящий из виртуальных дисков SCSI. Большая часть из них работает нормально: если я закрываю виртуальную машину и удаляю один из дисков, при перезапуске массив отображается как деградированный, но данные остаются нетронутыми. Затем я могу повторно добавить диск в массив и восстановить его без проблем.
Проблема возникает, если я пытаюсь удалить диск, пока виртуальная машина все еще включена. То есть, пока виртуальная машина включена, я захожу в настройки этой виртуальной машины и удаляю один из дисков SCSI. В этом случае Linux, похоже, не осознает, что диск исчез, и массив не переходит в режим пониженной производительности. Вместо этого я получаю множество предупреждений в / var / log / messages от STORVSC о кодах состояния scsi. И вместо того, чтобы корректно выходить из строя или переходить в ухудшенный режим, массив просто начинает возвращать поврежденные данные..
Я буквально не могу думать о хуже результат здесь - в случае отказа диска в массиве RAID он решает просто начать возвращать поврежденные данные? Неужели нет?
Я сделал что-то ужасно неправильное здесь или это как должно работать?
Хост-система - Windows Server 2008 R2 Standard x64. CentOS6 работает под управлением ядра 2.6.32-71.29.1.el6.x86_64. RAID-массив был создан с помощью mdadm. Я не испортил ни одного внутреннего устройства ОС - это в основном новая установка.
Это вполне может быть проблемой с HyperV. Я не могу сказать ничего окончательного, но я знаю, что в серверных средах вы должны использовать диски с TLER (ограниченное по времени восстановление после ошибок), чтобы этот диск не зависал в режиме повтора все время, а вместо этого позволял ОС очень скоро узнает, что она мертва.
Мой опыт работы с программным RAID Linux с обычными дисками RAID показывает, что массивы деградируют при отказе диска, но система действительно не продолжает работать должным образом.
Я бы рекомендовал попробовать это на реальном оборудовании, потому что такие вещи, как время восстановления, проблемы с шиной и т. Д., На самом деле не эмулируются. Также имейте в виду, что когда вы собираетесь тестировать отключение дисков, результаты будут очень зависеть от того, есть ли у вас поддержка горячего подключения, и если вы подключили 3,3 В к вилке питания SATA (преобразователи molex-to-sata этого не делают .. .)