Как лучше всего проверить наличие ошибок жесткого диска и ранних признаков сбоя в CentOS?
dmesg
Ядро будет регистрировать любые диагностические сообщения об устройствах ввода-вывода, поэтому вы можете проверить эти сообщения с помощью команды dmesg.
Я бы рекомендовал установить smartmon (http://sourceforge.net/apps/trac/smartmontools/wiki) на ваш компьютер это программное обеспечение, которое может проверять состояние ваших дисков, иначе оно будет проверять / var / log / messages или / var / log / syslog на наличие каких-либо упоминаний об ошибках scsi.
Вы можете запустить fsck на устройстве, чтобы проверить наличие ошибок.
SMART-мониторинг - хороший способ. Как root, smartctl -a /dev/hda
, где hda - это желаемый диск ... может быть hdb, sda и т. д. Также рекомендуется указать адрес электронной почты в / etc / aliases в качестве человека, который должен получать почту root.
Хотя это очень расплывчатый ответ. Если у вас есть сервер от одного из крупных производителей (Dell, HP и т. Д.), Скорее всего, доступны лучшие возможности мониторинга.
Как говорит Пол, журналы SMART - хорошее место для проверки.
Я также рекомендую бегать BadBlocks. Если у вас есть карта RAID, возможно, вам придется использовать для нее мониторинг.
Вы можете попробовать полную проверку раздела / dev / sda1 (например) как
fsck -f /dev/sda1
или попробуйте выполнить полный неразрушающий тест записи-чтения данного раздела
badblocks -vn /dev/sda1