Назад | Перейти на главную страницу

Tar: избегать архивирования файлов больше определенного размера

Я хочу заархивировать файлы (с помощью tar) размером менее 3 МБ. Но я также хочу сохранить каталоги, в которых существуют эти файлы. (поэтому я не могу использовать find команда). Я просто хочу избегать файлов размером более 3 МБ. Как это может быть сделано?

Проще, чем вы думаете:

$ tar cf small-archive.tar /big/tree --exclude-from <(find /big/tree -size +3M)

В наполовину связанной заметке (касающейся вашего утверждения, что вы не можете использовать find), чтобы получить список всех файлов (включая каталоги) по пути за вычетом файлов размером более 3 МБ, используйте:

$ find . -size -3M -o -type d

Затем вы можете сделать:

$ tar cf small-archive.tar --no-recursion --files-from <(find /big/tree -size -3M -o -type d)

Но я бы предпочел первый, так как он проще, ясно выражает то, что вы хотите, и приведет к меньшему количеству сюрпризов.

Если имя файла содержит квадратные скобки, в некоторых системах необходимо явно исключить. Например

$ mkdir test
$ echo "abcde123456" > ./test/a[b].txt
$ echo "1" > ./test/a1.txt
$ ls -la ./test
total 16
drwxrwxr-x 2 user user 4096 Jan 10 16:38 .
drwx------ 4 user user 4096 Jan 10 16:38 ..
-rw-rw-r-- 1 user user    2 Jan 10 16:38 a1.txt
-rw-rw-r-- 1 user user   12 Jan 10 16:38 a[b].txt
$ tar -zcvpf a.tar.gz ./test
./test/
./test/a[b].txt
./test/a1.txt
$ tar -zcvpf a3.tar.gz ./test --exclude-from <(find ./test -type f -size +3c)
./test/
./test/a[b].txt
./test/a1.txt
$ tar -zcvpf ax.tar.gz ./test --exclude-from <(find ./test -type f -size +3c) --exclude '*\[*'
./test/
./test/a1.txt

Если вы пытаетесь сделать это на сервере через SSH, это не сработает из-за этот. Чтобы обойти это, вы можете использовать каналы и xargs:

find /path/to/dir -type f -size -3M | xargs tar cf archive.tar