Назад | Перейти на главную страницу

Оптимальная конфигурация RAID + LVM

Я новичок в управлении LVM и RAID.

У меня есть Linux-машина (Ubuntu 18.04) с двумя жесткими дисками по 4 ТБ, которые объединены в группу LVM. Этот компьютер также оснащен двумя твердотельными накопителями объемом 1,8 ТБ. ОС устанавливается на отдельный накопитель NVME.

Недавно нашим начальством было приобретено еще 10 SSD по 4 Тб. 8 из них я установил в ПК, два других диска остались в запасных частях (на все десять не было свободных слотов).

В связи с ограничениями по гарантии от поставщика ПК я не могу заменить жесткие диски или твердотельные накопители объемом 1,8 ТБ на твердотельные накопители емкостью 4 ТБ. Я могу просто добавить новые SSD.

Я бы хотел использовать все эти твердотельные накопители как одно большое хранилище данных с возможностью восстановления после ошибок.

Целью этого хранилища данных является хранение наборов данных для задач машинного обучения (многие относительно небольшие файлы доступны случайным образом).

Из того, что я прочитал, я пришел к выводу, что мне следует присоединить эти диски к одной или нескольким группам RAID5, а затем создать группу LVM поверх них.

Однако я не могу определить оптимальную группировку.

Ситуация несколько осложняется тем, что некоторые из этих дисков уже используются, и данные не должны теряться. И дополнительных дисков для резервного копирования у меня нет.

Моя текущая конфигурация следующая: пять твердотельных накопителей емкостью 4 Тбайт бесплатны и не отформатированы; один твердотельный накопитель емкостью 4 Тбайт занят почти на 100%, два твердотельных накопителя емкостью 1,8 Тбайт и два твердотельных накопителя емкостью 4 Тбайт объединены в одну группу LVM.

Вот результат lsblk:

NAME        MAJ:MIN RM  SIZE RO TYPE MOUNTPOINT
loop0         7:0    0 89.1M  1 loop /snap/core/7917
loop1         7:1    0 89.1M  1 loop /snap/core/8039
sda           8:0    0  3.7T  0 disk
└─vg0-lv--0 253:0    0 10.8T  0 lvm  /ssdata
sdb           8:16   0  3.7T  0 disk
└─vg0-lv--0 253:0    0 10.8T  0 lvm  /ssdata
sdc           8:32   0  3.7T  0 disk
sdd           8:48   0  3.7T  0 disk
sde           8:64   0  1.8T  0 disk
└─vg0-lv--0 253:0    0 10.8T  0 lvm  /ssdata
sdf           8:80   0  1.8T  0 disk
└─vg0-lv--0 253:0    0 10.8T  0 lvm  /ssdata
sdg           8:96   0  3.7T  0 disk
└─vg1-lv--0 253:1    0  7.3T  0 lvm  /home
sdh           8:112  0  3.7T  0 disk
└─vg1-lv--0 253:1    0  7.3T  0 lvm  /home
sdi           8:128  0  3.7T  0 disk /mnt/SAITds
sdj           8:144  0  3.7T  0 disk
sdk           8:160  0  3.7T  0 disk
sdl           8:176  0  3.7T  0 disk
nvme0n1     259:0    0  477G  0 disk
├─nvme0n1p1 259:1    0    1M  0 part
├─nvme0n1p2 259:2    0  200G  0 part /
├─nvme0n1p3 259:3    0  150G  0 part
└─nvme0n1p4 259:4    0  127G  0 part [SWAP]

Этот вывод показывает мои предыдущие эксперименты. Я играл с группировкой LVM и расширенной группой SSD LVM с еще двумя твердотельными накопителями емкостью 4 ТБ.

Мои вопросы:

как лучше всего объединить эти диски в RAID и LVM?

я прав, что массив RAID5 невозможен на дисках разного размера?

каков может быть алгоритм для "онлайн" создания и увеличения групп RAID / LVM, чтобы данные сохранялись (разрешено перемещение данных в другой каталог)?

Обновление: материнская плата этого компьютера - ASUS Z10PE-D8 WS. Согласно технические характеристики, он поддерживает RAID - 0, 1, 5 и 10. Однако я не могу понять, что означает эта «поддержка».

Итак, у меня есть два варианта: программный рейд Linux с утилитами md или аппаратный рейд с материнской платы.