Я управляю некоторыми системами unix, и пользователи в моей системе создают много мусора и засоряют свои рабочие места. Я сталкиваюсь с полной файловой системой каждый день. Много терабайты взаперти и пустая трата времени.
Есть процессы очистки которые cron'd работает каждый день или около того, но некоторые типы файлов, такие как резервная копия очень большого файла уха, дамп базы данных не будет определяется по образцу соответствие. Я даже подумываю взорвать их аккаунты, но это может включать побочный ущерб.
Какие есть инструменты / процессы / методы Чтобы создать рабочую среду, я могу помочь вам не тратить зря дисковое хранилище, не подвергая их ядерной бомбардировке.
Невозможно автоматически определить, какие файлы могут быть важны для ваших пользователей, а какие нет. Даже большие и старые файлы журналов, которые не менялись в течение недель или месяцев, могут по-прежнему содержать важную информацию. Используйте дисковые квоты и позвольте пользователям говорить с вами, если им нужно больше места.
Еще одна вещь, которую я помню из своего студенческого времени, - это несколько общедоступный (но только в пределах местного отдела) лист бумаги, содержащий упорядоченный список имен пользователей и их текущих размеров домашних каталогов. Более дружелюбная версия зала стыда. Это позволяет вашим пользователям понять, когда они используют намного больше дисковых ресурсов, чем другие. Но я думаю, это приемлемо только для небольшой группы людей, которые хорошо знают друг друга.
Я думаю, вам следует ввести квоты для своих пользователей. Таким образом, они могут выйти за пределы своей квоты и не смогут загрузить больше материалов, но не смогут заполнить всю вашу файловую систему.
Вот хорошее руководство, как это сделать:
http://www.centos.org/docs/5/html/Deployment_Guide-en-US/ch-disk-quotas.html
Вы можете попробовать использовать logrotate, демон, который будет управлять журналами (и другими файлами) на основе созданных вами правил. Многие текстовые файлы сжимаются очень хорошо, журналы, например, часто достигают более 95% сжатия, потому что они повторяют одни и те же термины снова и снова. Намного безопаснее, чем удаление, поскольку вы не удалили данные, а только сжали их.
Как было сказано ранее, данные USER очень сложно архивировать / управлять (хотя вы можете, в зависимости от вашей файловой системы и настроек, использовать дату последнего доступа для автоматического архивирования некоторых вещей), но я рекомендую сначала ПЕРЕМЕСТИТЬ данные, которые вы собираетесь получить. избавиться от него, затем СЖАТЬ его и удалить только через достаточно долгий период, чтобы знать, что никто не зависит от него. Вы также можете рассмотреть возможность использования дешевого хранилища в качестве целевого объекта архива низкого уровня вместо удаления. Переместите файл туда и используйте мягкую символическую ссылку, чтобы указать на новое место.