Название действительно говорит само за себя! Как я могу отправить электронное письмо, если состояние физического диска ухудшается? Также как побочный момент, как я могу сделать то же самое для программного рейда или состояния массива zfs?
Используйте Smartmontools с Ubuntu. Следующее - хорошее руководство, и я использовал его на своем домашнем настольном компьютере. Поскольку это рабочий стол, я использую GSmartControl, который обеспечивает приятный интерфейс.
https://help.ubuntu.com/community/Smartmontools
Для своих производственных серверов (которые не являются Ubuntu) я все еще использую Smartmontools. Это архаично, но это лучшее, что есть на свете.
Это зависит от множества вещей. Многие рейд-контроллеры имеют свои собственные инструменты для запроса такой информации;
Контроллеры HP SmartArray используют HP hpacucli
-инструмент. Я бы вообще рекомендовал использовать этот плагин nagios для проверки состояния этих дисков и сервера HP в целом.
На серверах DELL есть собственные openmanage
-драйверы, которых нужно запросить. Для этого нужно найти хороший Nagios-плагин Вот.
Если ваши жесткие диски поддерживают S.M.A.R.T (я думаю, что все они в настоящее время поддерживают), вы можете использовать check_smartmon.
Оба вышеперечисленных проверяют состояние RAID, а также физических дисков. В некоторых случаях, если вы обязательно обновляете плагины время от времени, вам также сообщат, когда уместно обновить прошивку.
Для программного RAID в Linux: check_md_adm может быть использован.
На Nagios Exchange есть плагин для мониторинга ZFS-пулов: ссылка на сайт.