Назад | Перейти на главную страницу

Как я могу локально анализировать журналы SMART с сервера?

У меня дома на настольном компьютере запущен сервер Ubuntu 10.04. Я перезагрузился, и машина была недоступна через 10 минут или около того. На этом этапе я должен был подключить консоль (монитор с помощью кабеля VGA). Вместо этого я выключил машину (удерживая кнопку питания в течение трех секунд). На этот раз я сделал подключите консоль, и fsck запустился. Я предполагаю, что в первый раз ящик был недоступен, потому что тогда тоже был запущен fsck. В любом случае, при следующей перезагрузке я не смог смонтировать раздел на одном из двух моих дисков емкостью 1,5 ТБ (/ dev / sdb1).

fsck /dev/sdb1 обнаружил некоторые ошибки (краткое чтение? что-то в этом роде), но fsck -Cy /dev/sdb1 исправил их, и я смог смонтировать и использовать раздел.

С тех пор я установил smartmontools и настроил его для работы в качестве демона после это руководство. Если я сбегу sudo service smartmontools restart, то root пользователь получает четыре письма со следующими ошибками:

Device: /dev/sda, 366 Currently unreadable (pending) sectors
Device: /dev/sdb, 13 Currently unreadable (pending) sectors
Device: /dev/sdb, 28 Offline uncorrectable sectors
Device: /dev/sda, 90 Offline uncorrectable sectors

Оба диска (все разделы) в остальном выглядят нормально: я не вижу ошибок приложения, странного поведения или ошибок / предупреждений в / var / log / {syslog, messages}.

Итак, напоследок несколько вопросов:

  1. Есть ли способ получить журналы SMART из коробки и проанализировать их локально, используя GSmartControl?
  2. Может ли убийство fsck midstream привести к повреждению оборудования?
  3. Если диски действительно в порядке, могу ли я как-то подавить / сбросить ошибки SMART?

Спасибо, -Адам

ОБНОВИТЬ: Диски вроде исправны:

# smartctl -H /dev/sda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

# smartctl -H /dev/sdb
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

На ваш первый вопрос: вот как я это делаю с дисками на контроллере 3Ware:

server $ smartctl -d 3ware,0 -a /dev/twa0 > smart.0
server $ smartctl -d 3ware,1 -a /dev/twa1 > smart.1
server $ smartctl -d 3ware,2 -a /dev/twa2 > smart.2
wks $ scp server:smart.* .
wks $ gsmartcontrol -q --no-scan --add-virtual smart.0 --add-virtual smart.1 --add-virtual smart.2