Назад | Перейти на главную страницу

Проверьте наличие ошибок / признаков сбоя жесткого диска на сервере CentOS

Как лучше всего проверить наличие ошибок жесткого диска и ранних признаков сбоя в CentOS?

dmesg

Ядро будет регистрировать любые диагностические сообщения об устройствах ввода-вывода, поэтому вы можете проверить эти сообщения с помощью команды dmesg.

Я бы рекомендовал установить smartmon (http://sourceforge.net/apps/trac/smartmontools/wiki) на ваш компьютер это программное обеспечение, которое может проверять состояние ваших дисков, иначе оно будет проверять / var / log / messages или / var / log / syslog на наличие каких-либо упоминаний об ошибках scsi.

Вы можете запустить fsck на устройстве, чтобы проверить наличие ошибок.

SMART-мониторинг - хороший способ. Как root, smartctl -a /dev/hda, где hda - это желаемый диск ... может быть hdb, sda и т. д. Также рекомендуется указать адрес электронной почты в / etc / aliases в качестве человека, который должен получать почту root.

Хотя это очень расплывчатый ответ. Если у вас есть сервер от одного из крупных производителей (Dell, HP и т. Д.), Скорее всего, доступны лучшие возможности мониторинга.

Как говорит Пол, журналы SMART - хорошее место для проверки.

Я также рекомендую бегать BadBlocks. Если у вас есть карта RAID, возможно, вам придется использовать для нее мониторинг.

Вы можете попробовать полную проверку раздела / dev / sda1 (например) как

fsck -f /dev/sda1

или попробуйте выполнить полный неразрушающий тест записи-чтения данного раздела

badblocks -vn /dev/sda1