Назад | Перейти на главную страницу

Какая стратегия лучше всего контролировать состояние жестких дисков?

Какие стратегии вы используете для мониторинга состояния жестких дисков вашего сервера? Планируете ли вы автоматическое выполнение chkdsk с отчетами? Как вас предупреждают о сбоях?

На самом деле в дисковой подсистеме есть за чем следить:

  • Состояние файловой системы: либо chkdisk, либо fsdisk (Файловая система - это не то же самое, что состояние физического массива, но, конечно, физические проблемы обычно приводят к повреждению FS).
  • Состояние RAID: включает состояние любой конфигурации рейда и батареи на контроллере рейда. Например, диск выпал из массива, он восстанавливается?
  • Прогнозируемый сбой каждого диска: см. УМНАЯ
  • Рабочая температура (не относится к дискам, но важно).
  • Последняя версия прошивки / драйверов

Вы также, вероятно, захотите следить за производительностью дисковой подсистемы:

  • Среднее время, затрачиваемое на операции чтения / записи
  • Количество чтений / записей
  • Очередь дисковых операций

Такая система, как Nagios, имеет различные плагины и может предупреждать об этих сбоях. Часто вам нужна такая утилита, как Dell openmanage или MegaCLI, для мониторинга состояния RAID через SNMP. Инструменты также могут сами предупреждать вас, но это не централизованно.

Большинство современных жестких дисков имеют встроенный мониторинг, который называется УМНАЯ. (вики)

Для вашей ОС существует множество инструментов, которые смогут это отслеживать.

Для окон загляните в

Бесплатное ПО Active @ Hard Disk Monitor просто как отправная точка

Ваш RAID-контроллер может быть встроен в S.M.A.R.T. мониторинг, так что посмотрите там, если это для сервера.

Журналы событий, WMI, SNMP.

Большинство RAID-контроллеров серверного уровня будут включать в себя программное обеспечение для включения одного или всех из них в Windows и других операционных системах.

Оповещения по электронной почте также часто доступны.

Мы проводим еженедельные или ежедневные проверки целостности наших RAID-массивов и делаем регулярные резервные копии.