У меня проблема с диском резервных копий, который не является частью RAID или чего-либо подобного (поэтому нет уведомлений от контроллера рейда, если диск умирает). Бывает, что диск полностью умирает, и единственное, что остается, - это точка монтирования, которая становится недоступной, если вы попытаетесь вставить в нее компакт-диск.
Есть ли способ отслеживать / получать предупреждения, если диск умирает? В моем распоряжении есть zabbix, и я нашел несколько умных скриптов, которые можно использовать, но я не уверен, что это сработает, так как не будет /dev/sdb
или /dev/sda
использовать смарт, когда диск умирает.
Если у кого-то есть сценарий или идея, которыми можно поделиться, я был бы признателен за это.
Я написал плагин nagios что вы можете адаптироваться к Zabbix. Я написал его, когда у нас была куча серверов Linux, которые были доступны только для чтения из-за случайных ошибок диска. Это помогло нам выявить проблемы на раннем этапе, и есть код для тестовой записи файла, но мы отключили его, чтобы проверка могла выполняться как неroot
.
/var/log/syslog
должен содержать некоторую информацию, относящуюся к отключению устройства; даже без создания стеков, таких как ELK (ElasticSearch, Logstash, Kibana) для анализа журнала, вы должны уметь отслеживать такие события с помощью таких инструментов, как сек.