Назад | Перейти на главную страницу

Лучший способ проверить новые жесткие диски на дешевый сервер хранения

Я хочу построить сервер хранения и купил 10 x 2TB WD RED's. В HDD's только что прибыл.

Есть ли какой-нибудь инструмент, который вы, ребята, используете для проверки неисправных дисков или лучшей защиты от детской смертности перед копированием реальных данных на свои диски?

Лучше проверить каждый сингл HDD или протестировать массив (ZFS raid-z2) путем копирования на него большого количества данных?

Это новые диски. Либо они потерпят неудачу, либо нет. Вы уже сделали огромный шаг вперед, используя файловую систему ZFS, что даст вам отличное представление о состоянии вашего рейда и файловой системы ...

Я бы ничего не делал, кроме построения массива. В этом суть избыточности. Вы не сможете вызвать сбой диска другими перечисленными методами.

У меня был такой же вопрос 2 месяца назад. После отправки отказавшего диска в моем NAS произошел сбой заменяющего диска через 3 дня. Поэтому я решил протестировать новую замену, прежде чем запустить ее в производство. Я не тестирую каждый новый диск, который покупаю, только на «отремонтированных» дисках, которым я не полностью доверяю.

Если вы решите протестировать эти диски, я бы рекомендовал запустить плохие блоки сканирование и расширенный тест SMART на новом жестком диске.

На диске 2 ТБ это занимает до 48 часов. Команда badblock записывает диск заполненным шаблоном, затем снова считывает блоки, чтобы увидеть, действительно ли шаблон существует, и повторяет это с 4 различными шаблонами.

Эта команда, вероятно, на самом деле не будет отображать плохие блоки на новом диске, поскольку в наши дни диски перераспределяют плохие блоки.

Итак, до и после этого я провел интеллектуальный тест и проверил количество перераспределенных и текущих ожидающих секторов. Если что-то из этого появилось, на вашем диске уже есть плохие блоки, поэтому он может оказаться ненадежным.

После этого я снова провожу расширенный SMART-тест.

Возможно, вы захотите сначала установить smartctl или smartmontools.

Предупреждение, флаг badblocks -w перезапишет все данные на вашем диске, если вы просто хотите выполнить проверку чтения, без перезаписи диска, используйте badblocks -vs /dev/sdX

sudo smartctl -a /dev/sdX
# record these numbers
sudo badblocks -wvs /dev/sdX
# let it run for 48 hours
sudo smartctl -a /dev/sdX
# compare numbers
sudo smartctl -t long /dev/sdX
# this might take another hour or 2, check results periodically with
sudo smartctl -a /dev/sdX

Если после этого ваши умные ценности кажутся нормальными, я бы доверял диску.

Чтобы узнать, что означает каждая интеллектуальная ценность, вы можете начать поиск здесь

http://en.wikipedia.org/wiki/Self-Monitoring,_Analysis,_and_Reporting_Technology

Вы можете использовать Bonnie ++ для тестирования. Он может идеально имитировать модель поведения файлового сервера.

Например:

# bonnie++ -u nobody -d /home/tmp -n 100:150000:200:100 -x 300

Тест будет запущен от имени пользователя none и создаст / перезапишет / удалит 100 * 1024 файлов, от 200 до 150000 байт на файл, в 100 автоматически созданных каталогах ниже / home / tmp. И количество тестов = 300. Вы можете поиграть с количеством / размером файлов и количеством повторений тестов.

Обычно я просто выполняю полную инициализацию RAID и, где это возможно, начинаю заполнять файловую систему во время этого, все время зная, что может быть проблема из-за мертвых дисков. Таким образом, я не трачу время на какие-то тесты, которые в любом случае весьма ненадежны, и сразу же обнаруживал действительно слабые диски. После этого вероятность отказа привода из-за «детской смертности» еще может быть выше, но практического способа устранить это не существует.

На практике ни один из последних нескольких сотен дисков, которые я использовал в RAID, не имел проблем в течение первого года работы.

Я работаю в компании, которая изо дня в день проводит подобное тестирование. И да, мы тестируем каждый покупаемый жесткий диск. Наш процесс начинается с запуска дисков через бесплатную программу на основе DOS под названием HDAT2. Его можно скачать бесплатно. Он может получить доступ к SMART и некоторым другим функциям накопителя, недоступным из среды Windows. В зависимости от результатов мы будем запускать их через одну из нескольких различных линий специализированного оборудования, но по сути они в основном просто запускают короткое самотестирование SMART, длительное тестирование, безопасное стирание и все чтение для проверки секторов. Я предлагаю выполнить безопасное стирание всего диска, затем выполнить все чтение, а затем короткую самопроверку SMART. Этот порядок важен, поскольку короткое самотестирование может ничего не найти, если оно будет запущено в начале вашего тестирования, но после полной записи и чтения диска оно может что-то обнаружить. Надеюсь это поможет.

Вы можете использовать набор тестов производителя или что-то вроде SpinRite зачистить весь диск. Также было бы неплохо посмотреть на УМНАЯ значений, поиск сбойных секторов и других признаков старения / сбоя.

Если вы действительно хотите протестировать, используйте badblocks написать тест. Он запишет шаблоны данных на диск, а затем прочитает их для проверки. При этом ваш диск будет немного нагружен. На мой взгляд, если он работает успешно, вы можете доверять диску.

Но я думаю, что ZFS и хорошего бэкапа достаточно.