Я хочу запустить самотестирование smartctl, чтобы проверить состояние дисков в моем массиве RAID (PERC 5 / i). Массив находится на sda и состоит из шести дисков. Я могу проверить статус с помощью
sudo smartctl /dev/sda -d megaraid,0 -a
И я вижу, что SMART доступен и включен на всех дисках. Я пытался запустить самотестирование, используя
sudo smartctl /dev/sda -d megaraid,0 -t short
и
sudo smartctl /dev/sda -d megaraid,0 -t long
Я также пробовал это на всех дисках 0-5. Что бы я ни старался, когда бегу:
sudo smartctl /dev/sda -d megaraid,0 -l selftest
Я всегда получаю один и тот же результат, который, кажется, всегда означает, что я никогда не запускал самотестирование.
/dev/sda [megaraid_disk_00] [SAT]: Device open changed type from 'megaraid' to 'sat'
===START OF READ SMART DATA SECTION ===
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
Из того, что я прочитал, у меня не должно возникнуть проблем с запуском короткого и длительного самотестирования массива, пока он установлен. Есть ли у кого-нибудь еще опыт выполнения этих тестов на рейд-массиве PERC 5 / i, который мог бы дать некоторое представление о том, что вызывает проблему?
(выпуск smartmontools 5.40 от 09.12.2009 в 21:00:32 UTC)
Это контроллер аппаратного массива Dell Perc 5 / i. Пусть делает свое дело. Если у вас нет красных или желтых индикаторов на дисках, зачем вам запускать своя УМНАЯ. тесты?
Контроллер массива использует S.M.A.R.T. в дополнение к другим функциям / тестам для определения работоспособности диска. Нет необходимости проводить собственный анализ.
Это старый тред, но позвольте мне сказать, что контроллеры HW, в частности, считываемые патрулем, имеют желать лучшего. Очевидно, они должны тестировать поверхность диска и исправлять проблемы, и они иногда это делают, но никогда не исправляют ожидающие сектора на поверхности, хотя они могут и должны использовать избыточные данные. Поэтому, когда у вас есть жесткий диск с интеллектуальными ошибками и вы хотите его отключить, вы не можете точно знать, что другой диск (например, в raid1) полностью читается, поэтому желательно провести длительный интеллектуальный тест. Да ... Я согласен с тем, что проверка согласованности может сработать, но это ухудшит массив, и вы потеряете данные, которые вы могли бы сохранить с помощью оптимального массива, который имеет неоткрытые или известные ошибки, но все еще имеет 100% читаемые данные. Дело в том, что в рейдовой прошивке есть ошибки, а внутренняя работа раздута. Они дают ложную защиту, которая более опасна, чем система, которая, как вы знаете, однажды наверняка выйдет из строя.