Я использую 3ware 9650SE-2LP Raid-контроллер для настройки RAID 1 с 2 дисками на некоторых новых серверах Ubuntu 10.04 x64.
Есть ли способ для сервера отправить мне уведомление при выходе из строя одного из дисков? Если возможно, я бы предпочел уведомление по электронной почте. Спасибо.
3ware предоставляет программу мониторинга / управления 3dm2. просто посмотрите на их веб-страницу, есть ее бинарная версия для linux, и она даже отлично работает [по крайней мере, под debian].
Дело в том, что я никогда не доверял этим модным инструментам ... поэтому я делаю следующее. поэтому я использую собственные скрипты на основе tw_cli, которые также можно загрузить с веб-сайта 3ware.
раз в неделю бегаю в патруль и читаю:
./tw_cli /c0/u0 start verify
и все время каждые 15 минут я сбрасываю текущее состояние рейда:
./tw_cli /c0 show > current.txt
Я использую очень простой плагин nagios, чтобы проверить, совпадает ли текущий статус с ожидаемым [я просто сравниваю содержимое файла с хорошо известным дампом статуса, который был сделан в начале].
#!/bin/bash
if [ `diff current.txt expected.txt|wc -l` -ne 0 ] ; then
echo "CRITICAL - current state of raid does not match expected pattern "
exit 2
fi
if [ `find . -name current.txt -mmin -16|wc -l` -ne 1 ] ; then
echo "CRITICAL - state file is old "
exit 2
fi
echo "OK"
exit 0
вы бы вероятно поставили рассылку вместо exit 2 ... или, что еще более вероятно, использовали бы 3dm2.