Назад | Перейти на главную страницу

Bash-Scripting - плагин Munin не работает

Я написал плагин munin для подсчета http-statuscodes lighttpd. Сценарий:

#!/bin/bash

######################################
# Munin-Script: Lighttpd-Statuscodes #
######################################

##Config
# path to  lighttpd access.log
LIGHTTPD_ACCESS_LOG_PATH="/var/log/lighttpd/access.log"
# rows to parse in logfile (higher value incrase time to run plugin. if value to low you may get bad counting)
LOG_ROWS="200000"
#
#munin
case $1 in
   autoconf) # check config
        AVAILABLE=`ls $LIGHTTPD_ACCESS_LOG_PATH`
        if [ "$AVAILABLE" = "$LIGHTTPD_ACCESS_LOG_PATH" ]; then
           echo "yes"
        else
           echo "No: "$AVAILABLE
           echo "Please check your config!"
        fi
        exit 0;;
   config) # graph config
        cat <<'EOM'
graph_title Lighhtpd Statuscodes
graph_vlabel http-statuscodes / min
graph_category lighttpd
1xx.label 1xx
2xx.label 2xx
3xx.label 3xx
4xx.label 4xx
5xx.label 5xx
EOM
        exit 0;;
esac

## calculate
AVAILABLE=`ls $LIGHTTPD_ACCESS_LOG_PATH`
if [ "$AVAILABLE" = "$LIGHTTPD_ACCESS_LOG_PATH" ]; then
   TIME_NOW=`date`
   CODE_1xx="0"
   CODE_2xx="0"
   CODE_3xx="0"
   CODE_4xx="0"
   CODE_5xx="0"
   for i in 1 2 3 4 5; do
        TIME5=`date +%d/%b/%Y:%k:%M --date "$TIME_NOW -"$i"min"`
        CODE_1xx=$(( $CODE_1xx + `tail -n $LOG_ROWS $LIGHTTPD_ACCESS_LOG_PATH | grep "$TIME5" | grep 'HTTP/1.1" 1' | grep -c " "` ))
        CODE_2xx=$(( $CODE_2xx + `tail -n $LOG_ROWS $LIGHTTPD_ACCESS_LOG_PATH | grep "$TIME5" | grep 'HTTP/1.1" 2' | grep -c " "` ))
        CODE_3xx=$(( $CODE_3xx + `tail -n $LOG_ROWS $LIGHTTPD_ACCESS_LOG_PATH | grep "$TIME5" | grep 'HTTP/1.1" 3' | grep -c " "` ))
        CODE_4xx=$(( $CODE_4xx + `tail -n $LOG_ROWS $LIGHTTPD_ACCESS_LOG_PATH | grep "$TIME5" | grep 'HTTP/1.1" 4' | grep -c " "` ))
        CODE_5xx=$(( $CODE_5xx + `tail -n $LOG_ROWS $LIGHTTPD_ACCESS_LOG_PATH | grep "$TIME5" | grep 'HTTP/1.1" 5' | grep -c " "` ))
   done
        CODE_1xx=$(( $CODE_1xx / 5 ))
        CODE_2xx=$(( $CODE_2xx / 5 ))
        CODE_3xx=$(( $CODE_3xx / 5 ))
        CODE_4xx=$(( $CODE_4xx / 5 ))
        CODE_5xx=$(( $CODE_5xx / 5 ))

        echo "1xx.value "$CODE_1xx
        echo "2xx.value "$CODE_2xx
        echo "3xx.value "$CODE_3xx
        echo "4xx.value "$CODE_4xx
        echo "5xx.value "$CODE_5xx
else
        echo "1xx.value U"
        echo "2xx.value U"
        echo "3xx.value U"
        echo "4xx.value U"
        echo "5xx.value U"
fi

Если я запускаю сценарий на локальном компьютере, он работает отлично:

root@server1 /etc/munin/plugins # ll
lrwxrwxrwx 1 root root   45 2011-12-19 15:23 lighttpd_statuscodes -> /usr/share/munin/plugins/lighttpd_statuscodes*
root@server1 /etc/munin/plugins # ./lighttpd_statuscodes autoconf
yes
root@server1 /etc/munin/plugins # ./lighttpd_statuscodes config
graph_title Lighhtpd Statuscodes
graph_vlabel http-statuscodes / min
graph_category lighttpd
1xx.label 1xx
2xx.label 2xx
3xx.label 3xx
4xx.label 4xx
5xx.label 5xx 
root@server1 /etc/munin/plugins #./lighttpd_statuscodes
1xx.value 0
2xx.value 5834
3xx.value 1892
4xx.value 0
5xx.value 0 

Но Мунин не показывает графика: http://s1.directupload.net/images/111219/3psgq3vb.jpg

Я протестировал плагин с munin-server через telnet:

root@munin-server /etc/munin/plugins/ # telnet 123.123.123.123 4949
Trying 123.123.123.123...
Connected to 123.123.123.123.
Escape character is '^]'.
# munin node at server1.cluster1
fetch lighttpd_statuscodes
1xx.value U
2xx.value U
3xx.value U
4xx.value U
5xx.value U
.
Connection closed by foreign host.

Вы можете видеть в скрипте, что value = U выводится только тогда, когда скрипт не может проверить access.log lighttpd. Но почему скрипт не может этого сделать при запуске через munin, а при запуске на локальной машине все в порядке?

Есть ли ошибка в моем bash-скрипте? Я понятия не имею. Спасибо за помощь!

Не проверяйте скрипты munin с запуском только прямых скриптов. Это неправильный путь. Есть специальный скрипт на perl munin-run который выполняет сценарии точно так же, как и во время обновления munin, и вы сможете найти все ошибки. Возможно, вам потребуется определить специальные настройки для вашего скрипта. Вы можете сделать это в /etc/munin/plugin-conf.d/munin-node файл следующим образом:

[script_file_mask_*]
user USER_FOR_YOR_SCRIPT
env.VARIABLE some_variable

В вашем случае кажется, что скрипту просто не удалось прочитать файл журнала. Так что добавьте

[lighttpd_*]
user root

в /etc/munin/plugin-conf.d/munin-node и перезапустите munin-node. Это должно помочь.

Не знаю, удалось ли вам когда-нибудь исправить это самостоятельно, но я это сделал и подумал, что поделюсь своим решением.

Раш был прав, предлагая запустить его как root, но настоящая ошибка, похоже, связана с вашим выбором имени для ваших полей (1xx, 2xx, 3xx, ...). Согласно эта страница вики:

Каждый источник данных в плагине должен быть идентифицирован по имени поля. Следующее описывает название поля:
* Символы должны быть [a-zA-Z0-9_], а первый символ должен быть [a-zA-Z_].

Вот почему вы когда-либо видели на своем графике только 5xx и никаких результатов. При создании файлов rdd munin заменил числа символом подчеркивания (например, _xx), что означало, что данные были перезаписаны для каждого из 5 полей. Простое решение - добавить букву к именам полей, например:

graph_category lighttpd
T1xx.label 1xx
T2xx.label 2xx
T3xx.label 3xx
T4xx.label 4xx
T5xx.label 5xx
EOM

        echo "T1xx.value "$CODE_1xx
        echo "T2xx.value "$CODE_2xx
        echo "T3xx.value "$CODE_3xx
        echo "T4xx.value "$CODE_4xx
        echo "T5xx.value "$CODE_5xx
else
        echo "T1xx.value U"
        echo "T2xx.value U"
        echo "T3xx.value U"
        echo "T4xx.value U"
        echo "T5xx.value U"
fi

Вот так ваш сценарий отлично работает.

Регистрироваться /etc/munin/munin-node.conf какое имя пользователя запускается под munin, и может ли этот пользователь читать файлы журнала lighttpd.