Назад | Перейти на главную страницу

Ubuntu: контролировать аппаратный RAID и уведомлять о сбое?

Я использую 3ware 9650SE-2LP Raid-контроллер для настройки RAID 1 с 2 дисками на некоторых новых серверах Ubuntu 10.04 x64.

Есть ли способ для сервера отправить мне уведомление при выходе из строя одного из дисков? Если возможно, я бы предпочел уведомление по электронной почте. Спасибо.

3ware предоставляет программу мониторинга / управления 3dm2. просто посмотрите на их веб-страницу, есть ее бинарная версия для linux, и она даже отлично работает [по крайней мере, под debian].

Дело в том, что я никогда не доверял этим модным инструментам ... поэтому я делаю следующее. поэтому я использую собственные скрипты на основе tw_cli, которые также можно загрузить с веб-сайта 3ware.

раз в неделю бегаю в патруль и читаю:

./tw_cli /c0/u0 start verify

и все время каждые 15 минут я сбрасываю текущее состояние рейда:

./tw_cli /c0 show > current.txt

Я использую очень простой плагин nagios, чтобы проверить, совпадает ли текущий статус с ожидаемым [я просто сравниваю содержимое файла с хорошо известным дампом статуса, который был сделан в начале].

#!/bin/bash

if [ `diff current.txt expected.txt|wc -l` -ne 0 ] ; then
        echo "CRITICAL - current state of raid does not match expected pattern "
        exit 2
fi

if [ `find . -name current.txt -mmin -16|wc -l` -ne 1 ] ; then
        echo "CRITICAL - state file is old "
        exit 2
fi
echo "OK"
exit 0

вы бы вероятно поставили рассылку вместо exit 2 ... или, что еще более вероятно, использовали бы 3dm2.