Назад | Перейти на главную страницу

Вычислить сумму нескольких размеров файлов в Bash

У меня есть список файлов в файле, cache_temp.

В файле cache_temp:

/home/maildir/mydomain.com/een/new/1491397868.M395935P76076.nm1.mydomain.com,S=1740,W=1777
/home/maildir/mydomain.com/een/new/1485873821.M199286P14170.nm1.mydomain.com,S=440734,W=446889
/home/maildir/mydomain.com/td.pr/cur/1491397869.M704928P76257.nm1.mydomain.com,S=1742,W=1779:2,Sb
/home/maildir/mydomain.com/td.pr/cur/1501571359.M552218P73116.nm1.mydomain.com,S=1687,W=1719:2,Sa
/home/maildir/mydomain.com/td.pr/cur/1498562257.M153946P22434.nm1.mydomain.com,S=1684,W=1717:2,Sb

У меня есть простой скрипт для получения размера файлов из cache_temp:

#!/bin/bash

for i in `grep -v ^# ~/cache_temp | grep -v "dovecot.index.cache"`; do
    if [ -f "$i" ]; then
        size=$(du -sh "$i" | awk '{print $1}')
        echo $size
    fi
done

У меня есть список размеров файлов:

4,0K
4,0K
4,0K
432K
4,0K

Как я могу рассчитать их сумму?

Согласно du (1), есть опция -c, цель которой - произвести общую сумму.

% du -chs * /etc/passwd
92K ABOUT-NLS
196K    NEWS
12K README
48K THANKS
8,0K    TODO
4,0K    /etc/passwd
360K    total

Использовать stat вместо того du:

#!/bin/bash

for i in `grep -v ^# ~/cache_temp | grep -v "dovecot.index.cache"`; do
     [ -f "$i" ] && totalsize=$[totalsize + $(stat -c "%s" "$i")]
done
echo totalsize: $totalsize bytes

Если вам нужно использовать файл, мы надеемся, что этот фрагмент будет эффективным.

xargs -a cache_file stat --format="%s" | paste -sd+ | bc -l

В xargs состоит в том, чтобы предотвратить превышение лимита аргументов, но получение максимального количества файлов за один вызов stat каждый раз.

Если вы удалите флаг «-h» из команды «du», вы получите необработанные размеры байтов. Затем вы можете добавить их с помощью ((a += b)) синтаксис:

a=0
for i in $(find . -type f -print0 | xargs -0 du -s | awk {'print $1'})
do
  ((a += i))
done
echo $a

В -print0 и -0 флаги для поиска / xargs используют строки с завершающим нулем для сохранения пробелов.

РЕДАКТИРОВАТЬ: оказывается, я печатаю медленнее, чем комментарии @HBruijn!

Что ж ... Хорошо это или плохо, но вот моя реализация этого. Я всегда предпочитал использовать «while» для чтения строк из файлов.

#!/bin/bash

SUM=0
while read file; do
    SUM=$(( $SUM + $(stat $file | awk '/Size:/ { print $2 }') ))
done < cache_temp
echo $SUM

Рекомендация Яноша ниже:

#!/bin/bash

while read file; do
    stat $file
done < cache_temp | awk 'BEGIN { s=0 } $1 == "Size:" { s=s+$2 } END  { print s; }'