Я настраиваю Linux-сервер на хосте ESX 4.1. На этом сервере должно храниться несколько ТБ данных. В настоящее время мы обсуждаем, стоит ли использовать LVM. Наши текущие рассуждения таковы, что лучше всего иметь несколько томов 2 ТБ (ограничение, налагаемое ESX), смонтированные на отдельных томах как таковых.
/disk1 - 2TB
/disk2 - 2TB
/disk3 - 2TB
Мы будем хранить каталоги размером от 100 до 400 ГБ. Эти каталоги должны храниться целиком и не могут быть разделены. Проблема заключается в том, что будет много потраченного впустую места, если в конечном итоге у нас будет 1,7 ТБ, хранящихся на / disk1, и нам нужно будет хранить дополнительные 400 ГБ. В этом случае нам нужно будет сохранить каталог 400 ГБ на / disk2, оставив 300 ГБ неиспользованными.
Одним из решений этой проблемы является LVM, настроенный как:
--------
Disk 1 |
|
Disk 2 |---->/disk
|
Disk 3 |
--------
Однако мы зациклились на одном простом вопросе. Что произойдет, если Диск 2 выйдет из строя?
В первом сценарии очевидно, что произойдет, если диск 2 выйдет из строя, / disk2 больше не будет доступен.
В настройке LVM, если бы Диск 2 вышел из строя, был бы он аналогичен (например, только данные, которые хранились на Диске 2, больше не доступны) или все данные на / диске больше не будут доступны?
Вы пропустили ряд важных концепций абстракции, которые поставляются с LVM. Логические тома не обрабатывают диски - они размещаются в группах томов. В свою очередь, виртуальные группы состоят из физических томов, которые жестяная банка быть дисками. Короче говоря, группа VG не обнаружит отсутствующий PV, то есть отсутствующий диск, поэтому вы не сможете получить доступ к логическим томам в группе.
Есть процедуры восстановления, но обычно в виртуализированной среде вы все равно увидите доступность "все или ничего" - все файлы на диске будут содержаться в одном каталоге, который либо доступен со всем содержимым, либо не доступен вообще (если хранилище данных не доступны например).
Что касается эффективности хранения, рассмотрите возможность использования тонкое обеспечение - «Неиспользуемое» пространство не востребовано в хранилище данных. Однако это происходит за счет более высоких административных расходов.