Назад | Перейти на главную страницу

Сравнить / вычислить похожие файлы

У меня есть программа, генерирующая отчеты на постоянной основе.
Эти отчеты имеют простой и последовательный формат (в частности, это «отчеты профилирования OProfile»).
Формат каждой строки:

Уникальное_имя, номер

Я хочу просмотреть все имеющиеся у меня отчеты и вычислить (скажем) и среднее значение для каждого unique_name.

Как это можно было сделать?

bash grep

Предполагая, что все отчеты расположены в каталоге и имеют .txt расширение. Попробуй это:

$ cat *.txt | gawk -F, 'NF==2 { sum[$1] += $2; N[$1]++ } \
    END { for (name in sum) { \
        printf "%s %f\n", name, sum[name] / N[name]; } }' | sort -k2 -n