Назад | Перейти на главную страницу

Можно ли вывести список кэшированных файлов?

Здесь вывод free -m:

             total       used       free     shared    buffers     cached
Mem:          7188       6894        294          0        249       5945
-/+ buffers/cache:        698       6489
Swap:            0          0          0

Я почти вижу 6GB(5945 МБ) памяти из 7GB используется при кешировании файлов. Я умею смывать кеши. У меня вопрос: Можно ли увидеть, какие файлы (или inodes) кэшируются?

Ну там является простой способ взглянуть на кеш страницы ядра, если у вас есть инструменты - "fincore" дает вам некоторую сводную информацию о том, какие страницы файлов являются содержимым кеша.

Вам нужно будет предоставить список имен файлов, чтобы проверить их присутствие в кеше страницы. Это связано с тем, что информация, хранящаяся в таблицах кэша страниц ядра, будет содержать только ссылки на блоки данных, а не имена файлов. fincore будет разрешать блоки данных данного файла через данные inode и искать соответствующие записи в таблицах кэша страниц.

Не существует эффективного механизма поиска для выполнения обратных действий - получение имени файла, принадлежащего блоку данных, потребует чтения всех inodes и косвенных блоков в файловой системе. Если вам нужно знать о каждом отдельном блоке файла, хранящемся в кеше страницы, вам нужно будет предоставить список всех файлов в вашей файловой системе (ах) для fincore. Но это опять же, вероятно, испортит измерение, поскольку большой объем данных будет прочитан, проходя по каталогам и получая все inode и косвенные блоки - помещая их в кеш страницы и удаляя те самые данные кеша страницы, которые вы пытались изучить.

Вы можете использовать утилита vmtouch чтобы узнать, есть ли в кеше указанный файл или каталог. Вы также можете использовать этот инструмент для принудительного помещения элементов в кеш или блокировки их в кеше.

[root@xt ~]# vmtouch -v /usr/local/var/orca/procallator.cfg
/usr/local/var/orca/procallator.cfg
[     ] 0/5

           Files: 1
     Directories: 0
  Resident Pages: 0/5  0/20K  0%
         Elapsed: 0.000215 seconds

Теперь могу "потрогать" его в кеш.

[root@xt ~]# vmtouch -vt /usr/local/var/orca/procallator.cfg
/usr/local/var/orca/procallator.cfg
[OOOOO] 5/5

           Files: 1
     Directories: 0
   Touched Pages: 5 (20K)
         Elapsed: 0.005313 seconds

Теперь посмотрим, сколько кешируется ...

[root@xt ~]# vmtouch -v /usr/local/var/orca/procallator.cfg
/usr/local/var/orca/procallator.cfg
[OOOOO] 5/5

           Files: 1
     Directories: 0
  Resident Pages: 5/5  20K/20K  100%
         Elapsed: 0.000241 seconds

Я пишу очень простой сценарий оболочки для отображения кэшированных файлов с помощью linux-fincore. Поскольку кеш - это одна из частей памяти, мой код находит 10 наиболее часто используемых процессов RSZ, а также использование lsof для определения файлов, открытых в процессе, и, наконец, использование linux-fincore, чтобы узнать, кэшированы ли эти файлы или нет.

Пожалуйста, поправьте меня, если я ошибаюсь.

#!/bin/bash
#Author: Shanker
#Time: 2016/06/08

#set -e
#set -u
#you have to install linux-fincore
if [ ! -f /usr/local/bin/linux-fincore ]
then
    echo "You haven't installed linux-fincore yet"
    exit
fi

#find the top 10 processs' cache file
ps -e -o pid,rss|sort -nk2 -r|head -10 |awk '{print $1}'>/tmp/cache.pids
#find all the processs' cache file
#ps -e -o pid>/tmp/cache.pids

if [ -f /tmp/cache.files ]
then
    echo "the cache.files is exist, removing now "
    rm -f /tmp/cache.files
fi

while read line
do
    lsof -p $line 2>/dev/null|awk '{print $9}' >>/tmp/cache.files 
done</tmp/cache.pids


if [ -f /tmp/cache.fincore ]
then
    echo "the cache.fincore is exist, removing now"

    rm -f /tmp/cache.fincore
fi

for i in `cat /tmp/cache.files`
do

    if [ -f $i ]
    then

        echo $i >>/tmp/cache.fincore
    fi
done

linux-fincore -s  `cat /tmp/cache.fincore`

rm -f /tmp/cache.{pids,files,fincore}

Я написал следующий сценарий, который печатает все файлы и их состояние кеша с помощью команды pcstat. Это автономный скрипт для систем x86_64 linux. При необходимости загружает pcstat.

Первый аргумент - это местоположение файловой системы для анализа, а второй аргумент - это номер результата (Top N по количеству страниц в кеше).

#!/bin/bash
#Exit if a variable is not set
set -o nounset
#Exit on first error
set -o errexit

if [ $# -eq 0 ]; then
echo "Usage: $0 <root-dir> [number-of-results]"
echo
echo "Example $0 /var 10"
echo "will show top 10 files in /var which are loaded in cache"
exit
fi

ROOT=$1
#Number of results to show
HOW_MANY=50
[ -n ${2-} ] && HOW_MANY=$2


SCRIPT_DIR="$( cd -P "$( dirname "$0" )" && pwd )"
if [ ! -x $SCRIPT_DIR/pcstat ]; then
(
cd $SCRIPT_DIR
rm -f pcstat
curl -L -o pcstat https://github.com/tobert/pcstat/raw/2014-05-02-01/pcstat.x86_64
chmod +x pcstat
)
fi

FIND="find ${ROOT} -not ( -path /proc -prune ) -not ( -path /sys -prune ) -type f -size +0c -print0"
$FIND |  xargs -0 ${SCRIPT_DIR}/pcstat -terse -nohdr | sort --field-separator=, -r -n -k 6 | head -n ${HOW_MANY}

Вы также можете использовать pcstat (Статистика кэша страниц) https://github.com/tobert/pcstat

Надеюсь, это кому-то поможет.