Назад | Перейти на главную страницу

сиротские иноды через некоторое время -> режим ро

Предпосылки На сервере X3500 IBM с debian jessie поврежден один из 4-х дисков SAS в аппаратном RAID 5 (созданном с помощью контроллера сервера). С этого момента sda1 (один из образовавшихся разделов на raid sda disk) начинает иметь проблемы с потерянными inode.

Через некоторое время Debian обнаруживает 5 или 6 потерянных inode и переходит в режим только для чтения. Операционная система остается включенной, но многие службы больше не могут записывать на диск и останавливаются.

Перезагрузка сервера исправляет sda1 и запускается снова. Через некоторое время он снова запускается с осиротевшими индексными дескрипторами и так далее.

Если я загружаю сервер с минимальным lubuntu в режиме восстановления, fsck.ext4 -y / dev / sda1 завершается успешно. Кажется, все в порядке, система перезагружается, debian запускается снова, все работает гладко (кроме ProFTP, который не запускается сам по себе, но я должен его перезапустить) в течение получаса, а затем снова всегда те 5/6 сиротских инодов и система sda1 перекомпонован в режиме только для чтения. Я пытаюсь скопировать некоторые файлы на sda1 так же, но при следующем перезапуске inodes-сирот намного больше в количестве.

Как мне выйти из этой адской петли? Я не могу понять, это проблема HW (почему контроллер SAS не обнаруживает проблемы?) Или программного обеспечения.

TNX. Илич

P.S .: весь диск тестировался с контроллером SAS.

Подведем итог, как (я полагаю) я решил: - Я протестировал все диски один за другим (контроллер SAS не обнаружил проблем) - Я удалил по одному диску из RAID, а затем снова вставил его, ожидая после того, как предыдущий был "восстановлен". "в RAID

Думаю, целью было это второе действие. Моя гипотеза (подтвердите, пожалуйста, прав ли я или сделайте скидку, если я ошибаюсь): первый диск массива отслеживал отказ второго диска (тот, который сломался перед заменой) и привел его к обману Debian.

По сути, ошибок на самом деле не было, а только имитировали.

Я буду держать вас в курсе в случае появления новостей и опровержений этой теории.

Я бы заменил привод. У меня была аналогичная проблема с почтовым сервером, который некоторое время поправлялся, пока не вышел из строя катастрофически. (тысячи осиротевших inode) В моем случае я думаю, что это была проблема файловой системы, которую я усугубил, запустив e2fsck. Я заменил диск, и проблема исчезла.