Назад | Перейти на главную страницу

операция mdadm grow дает непрерывные ошибки libata

Запуск Debian 7, mdadm 3.2.5. Я выдал команду для увеличения 5 дисковых массивов, 3 резервных массива raid 5 до 8 дисков, 0 резервных массивов raid 6:

mdadm --grow /dev/md0 --level=6 --raid-devices=8 --backup-file=/root/raid5backup

Между одной и пятью секундами после раскрутки дисков раздается небольшой звук щелчка, и они останавливаются, и на консоль выводится масса сообщений об ошибках. Поиск в Google кусков этих сообщений (их количество увеличивается каждые 1-5 секунд, поэтому я не могу точно понять) наконец-то привел меня к эта страница с сообщением об ошибке libata.

Согласно этой связанной странице, моя проблема заключается в том, что «связь между устройством и хостом временно потеряна, но восстановлена». Похоже на ошибку шины - может быть, некачественный кабель? Эта машина имеет 11 устройств SATA, 6 сквозных разъемов и еще 5, разделенных на две карты расширения. Материнская плата абсолютно новая.

Я не уверен, что делать с сообщениями. Должен ли я выключиться и попробовать заменить кабели? Любые идеи?

Моя теория заключается в том, что источник питания для дисков не выдерживает нагрузки. Когда вы задаете порядок увеличения, все диски в массиве должны начать выполнять реальную работу. Это потребляет больше энергии. Источник питания не может подавать, и напряжение на приводы падает. Как только напряжение становится слишком низким, их двигатели ненадолго отключаются, вызывая звук щелчка, когда их головы перемещаются в безопасное положение, а их логические контроллеры теряют связь с вашим контроллером SATA, что вызывает ошибки. Когда двигатели отключаются, нагрузка на источник питания снижается, и напряжение, которое он выдает, восстанавливается до нормального уровня. Таким образом, приводы снова включаются, и цикл повторяется.

Вы можете попробовать другой источник питания, удалив пару дисков из системы (я знаю, что это непросто), или удалите другие источники, или переместите их извне (например, подключите вентиляторы к другому источнику питания). Или вы можете попробовать перебалансировать диски, чтобы разные кабели от блока питания. (Вы также можете проверить характеристики источника питания и подключенных устройств и убедиться, что вы находитесь в безопасном диапазоне.)