Мы отслеживаем диски на наших серверах с помощью Smartmontools и Nagios с помощью check_smartmon или другого плагина Nagios. Вроде работает, ошибок нет. Но как узнать, действительно ли он работает?
Было бы здорово смоделировать ошибку на диске и наблюдать за ошибкой по всему конвейеру Nagios. Есть ли способ вызвать ошибку SMART на диске или массиве из командной строки Linux или FreeBSD, не повредив диск?
Я нашел старое обсуждение smartmontools-поддержка список рассылки, но неясно, добавлялась ли эта функция когда-либо.
Если прошивка накопителя это поддерживает, hdparm
может использоваться для ручного повреждения некоторых секторов через его --make-bad-sector
вариант. Обратите внимание, что это будет действительно повредить сектор, а это значит, что:
Current Pending Sector
Reallocated Sector Count
Обратите внимание, что hdparm
различает «нормальное» и «помеченное» повреждение: в первом случае любое чтение будет тайм-аутом, как если бы сектор был действительно плохим; в последнем случае любое чтение будет немедленно прервано.
Обязательно поймите, что, используя описанный выше метод, вы действительно повреждение секторов с событиями относительного перераспределения - т.е. вы каким-то образом "повреждаете" свой диск.
Наконец, чтобы восстановить сектор до его перераспределения, вы можете использовать --repair-sector
вариант.
Вернуться к smartmontools
: вы можете использовать старый диск для моделирования таких ошибок, давая smartd
шанс предупредить вас и проверить эффективность вашего smartctl
конфигурация.
Невозможно смоделировать повреждение жестких дисков без проверки реальных повреждений Smartmontools "мощность". Smartmontools действительно хороший инструмент, он рабочий, всегда безопасный и надежный. Можно вместо этого получить жесткий диск с битыми секторами?