Сегодня утром, когда я пришел на работу, я обнаружил, что мой вычислительный сервер не отвечает: я провел на нем несколько вычислений в эти выходные, и сегодня утром он не хотел отвечать. Экраны остались выключенными, и когда я попытался подключиться к моему компьютеру через ssh, он не ответил.
Я сделал на нем полную перезагрузку, и компьютер перезагрузился.
Когда я попытался получить доступ к моему массиву RAID0 (2 диска), я обнаружил, что автоматическое монтирование больше не работает.
Я попытался смонтировать его вручную, используя sudo mount -a, затем:
mount: / DATA: Невозможно сделать суперблок на адресе / dev / md126. (не могу прочитать суперблок по адресу / dev / md1126)
Вот мой fstab. У меня есть диск nvme для системы и raid0 для данных: cat / etc / fstab
# / etc / fstab: информация о статической файловой системе.
# Используйте 'blkid', чтобы распечатать универсальный уникальный идентификатор для
# устройство; это можно использовать с UUID = как более надежный способ именования устройств
# работает даже при добавлении и удалении дисков. См. Fstab (5).
#
# / был на / dev / nvme0n1p2 во время установки
UUID = 1488f5bf-f88d-48b5-a5a0-6c590d4583fd / ext4 errors = remount-ro 0 1
# своп был на / dev / nvme0n1p1 во время установки
UUID = 666f87e9-ce39-4af5-b812-33a9746561fb нет swap sw 0 0
/ dev / disk / by-uuid / 7a0700a4-ec4c-4192-a074-b3fd0f31aa75 / DATA auto nosuid, nodev, nofail, x-gvfs-show 0 0
Я искал в Интернете, как это исправить, и нашел несколько команд, которые могут предоставить некоторую информацию:
sudo fdisk -l
Disque / dev / loop0: 140 MiB, 146841600 октетов, 286800 секунд Единицы: защита 1 × 512 = 512 октетов Taille de secteur (логика / телосложение): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный): 512 октетов / 512 октетов
Disque / dev / loop1: 2,3 MiB, 2428928 октетов, 4744 секунд Единицы: secteur de 1 × 512 = 512 октетов Taille de secteur (логика / телосложение): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный ): 512 октетов / 512 октетов
Disque / dev / loop2: 139,5 MiB, 146276352 октета, 285696 секунд Unités: secteur de 1 × 512 = 512 октетов Taille de secteur (logique / Physique): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный) ): 512 октетов / 512 октетов
Disque / dev / loop3: 13 MiB, 13594624 октета, 26552 сектера Единицы: secteur de 1 × 512 = 512 октетов Taille de secteur (логика / телосложение): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный): 512 октетов / 512 октетов
Диск / dev / loop4: 12,2 МБ, 12804096 октетов, 25008 секунд Единицы: защита 1 × 512 = 512 октетов Защита (логика / телосложение): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный ): 512 октетов / 512 октетов
Disque / dev / loop5: 3,7 MiB, 3813376 октетов, 7448 секунд Единицы: secteur de 1 × 512 = 512 октетов Taille de secteur (logique / Physique): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный) ): 512 октетов / 512 октетов
Disque / dev / loop6: 21 MiB, 22003712 октетов, 42976 секунд Единицы: secteur de 1 × 512 = 512 октетов Taille de secteur (логика / телосложение): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный): 512 октетов / 512 октетов
Disque / dev / loop7: 86,6 МБ, 90812416 октетов, 177368 секунд Единицы: защита 1 × 512 = 512 октетов Taille de secteur (логика / телосложение): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный ): 512 октетов / 512 октетов
Disque / dev / nvme0n1: 477 ГиБ, 512110190592 октета, 1000215216 секунд Единицы: 1 × 512 = 512 октетов Taille de secteur (логика / телосложение): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный): 512 октетов / 512 октетов Дискретный тип: dos Идентифицирующий диск: 0x7dd11723
Périphérique Amorçage Début Fin Secteurs Taille Id Тип / dev / nvme0n1p1 2048 63999999 63997952 30,5G 82 раздел подменю Linux / Solaris / dev / nvme0n1p2 * 64000000 1000214843 936214844 446,4G 83 Linux
Диск / dev / sdb: 1,8 ТиБ, 2000398934016 октетов, 3907029168 секунд Единицы: защита 1 × 512 = 512 октетов Taille de secteur (логика / телосложение): 512 октетов / 4096 октетов taille d'E / S (минимальный / оптимальный ): 4096 октетов / 4096 октетов
Диск / dev / sda: 1,8 ТиБ, 2000398934016 октетов, 3907029168 секунд Единицы: защита 1 × 512 = 512 октетов Taille de secteur (логика / телосложение): 512 октетов / 4096 октетов taille d'E / S (минимальный / оптимальный ): 4096 октетов / 4096 октетов
Disque / dev / md126: 3,7 ТиБ, 4000792444928 октетов, 7814047744 секунд Единицы: защита 1 × 512 = 512 октетов Taille de secteur (логика / телосложение): 512 октетов / 4096 октетов taille d'E / S (минимальный / оптимальный ): 16384 октета / 32768 октета
Disque / dev / loop8: 21,6 МБ, 22609920 октетов, 44160 секунд Единицы: защита 1 × 512 = 512 октетов Taille de secteur (logique / Physique): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный) ): 512 октетов / 512 октетов
Disque / dev / loop9: 3,3 Мбайт, 3411968 октетов, 6664 секунд Модули: 1 × 512 = 512 октетов Taille de secteur (logique / Physique): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный ): 512 октетов / 512 октетов
Disque / dev / loop10: 86,6 MiB, 90828800 октетов, 177400 секунд Единицы: secteur de 1 × 512 = 512 октетов Taille de secteur (логика / телосложение): 512 октетов / 512 октетов taille d'E / S (минимальное / оптимальное ): 512 октетов / 512 октетов
Disque / dev / loop11: 1,6 MiB, 1691648 октетов, 3304 секунд Единицы: secteur de 1 × 512 = 512 октетов Taille de secteur (logique / Physique): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный ): 512 октетов / 512 октетов
Disque / dev / loop12: 140 MiB, 146841600 октетов, 286800 секунд Единицы: secteur de 1 × 512 = 512 октетов Taille de secteur (логика / телосложение): 512 октетов / 512 октетов taille d'E / S (минимальный / оптимальный): 512 октетов / 512 октетов
Disque / dev / loop13: 86,6 МБ, 90759168 октетов, 177264 сек. Единицы: защита 1 × 512 = 512 октетов Taille de secteur (логика / телосложение): 512 октетов / 512 октетов taille d'E / S (минимальное / оптимальное ): 512 октетов / 512 октетов
sudo mdadm --examine / dev / md126
mdadm: суперблок md не обнаружен на / dev / md126.
sudo mdadm --examine / dev / sda
/ dev / sda: Магия: Intel Raid ISM Cfg Sig. Версия: 1.3.00 Orig Семейство: f9cade7c Семейство: f9cade7c Поколение: 0000001f Атрибуты: Все поддерживаемые UUID: 125118e9: 35e1a9ca: 35cfb5b8: 7184edc1 Контрольная сумма: 84a08e50 Правильные секторы MPB: 1 Диски: 2 RAID-устройства: 1
Disk00 Серийный номер: Z4Z38R88 Состояние: активный Id: 00000001 Полезный размер: 3907024136 (1863,01 ГиБ, 2000,40 ГБ)
[Volume1]: UUID: 9d14c84c: ee252990: 552570fe: 0a87621c Уровень RAID: 0 Участники: 2 слота: [UU] Неисправный диск: нет Этот слот: 0 Размер массива: 7814047744 (3726,03 ГиБ, 4000,79 ГБ) Размер для каждого разработчика: 3907024136 (1863,01 ГиБ 2000,40 ГБ) Смещение сектора: 0 Число полос: 122094496 Размер блока: 16 КиБ Зарезервировано: 0 Состояние переноса: бездействует Состояние карты: нормальное Грязное состояние: чистое
Disk01 Серийный номер: Z4Z38SNS Состояние: активный Id: 00000002 Полезный размер: 3907024136 (1863,01 ГиБ, 2000,40 ГБ)
sudo mdadm --examine / dev / sdb
/ dev / sdb: Магия: Intel Raid ISM Cfg Sig. Версия: 1.3.00 Orig Семейство: f9cade7c Семейство: f9cade7c Поколение: 0000001f Атрибуты: Все поддерживаемые UUID: 125118e9: 35e1a9ca: 35cfb5b8: 7184edc1 Контрольная сумма: 84a08e50 Правильные секторы MPB: 1 Диски: 2 RAID-устройства: 1
Disk01 Серийный номер: Z4Z38SNS Состояние: активный Id: 00000002 Полезный размер: 3907024136 (1863,01 ГиБ, 2000,40 ГБ)
[Volume1]: UUID: 9d14c84c: ee252990: 552570fe: 0a87621c Уровень RAID: 0 Участники: 2 слота: [UU] Неисправный диск: нет Этот слот: 1 Размер массива: 7814047744 (3726,03 ГиБ, 4000,79 ГБ) Размер для каждого разработчика: 3907024136 (1863,01 ГиБ 2000,40 ГБ) Смещение сектора: 0 Число полос: 122094496 Размер блока: 16 КиБ Зарезервировано: 0 Состояние переноса: незанято Состояние карты: нормальное Грязное состояние: чистое
Disk00 Серийный номер: Z4Z38R88 Состояние: активный Id: 00000001 Полезный размер: 3907024136 (1863,01 ГиБ, 2000,40 ГБ)
Мой raid disk, sda и sdb вроде в порядке и не мертв ... Проблема, кажется, исходит из суперблока md126
МОЙ ВОПРОС: как я могу восстановить / восстановить мой raid0 без потери данных? Не могли бы вы мне помочь?
(Кажется, мне придется использовать mdadm, но я не знаю как)
РЕДАКТИРОВАТЬ: подробнее cat / proc / mdstat
Персоналии: [raid0] [linear] [multipath] [raid1] [raid6] [raid5] [raid4] [raid10] md126: active raid0 sda [1] sdb [0] 3907023872 блокирует super external: / md127 / 0 16k chunks md127 : inactive sdb1 sda0 5032 блокирует super external: imsm неиспользуемые устройства:
Как вы уверены, что ваши диски в порядке? Вам нужно будет прочитать данные SMART, чтобы окончательно определить это, поскольку статуса "хорошо / плохо" недостаточно. Вы также можете собрать подробную информацию об общем массиве через mdadm --detail /dev/md126
чтобы получить обзор.
Кроме того, это RAID0. Он не предназначен для того, чтобы допускать любые неисправности устройства, даже небольшие локализованные, которые не вызывают состояние работоспособности всего диска. Даже отключение диска из массива на короткое время может разрушить RAID0. Этот узел обычно используется в паре с резервной копией или используется для данных, которые можно потерять сразу.
Что нужно сделать, это перестроить массив и восстановить из резервной копии, или, если вы не хотите использовать массив с меньшей целостностью, чем один диск, подумайте о другом уровне RAID. RAID 10 отлично работает с большинством шаблонов, может потерять два диска в массиве из четырех дисков, а диски дешевы.
Существуют файловые системы контрольного суммирования и менеджеры томов, такие как btrfs и zfs, и они прилагают усилия для обеспечения целостности данных, а также для предотвращения сбоев устройств.