Назад | Перейти на главную страницу

быстро заполняющийся диск: как понять, что происходит?

у меня есть org.apache.solr.hadoop.MapReduceIndexerTool/MorphlineMapper процесс, заполняющий локальное монтирование '/'.

Он работает в течение нескольких минут, диск заполняется, срабатывают предупреждения Nagios, а затем я завершаю процесс. Как только процесс завершается, использование файлов снова падает до базового уровня 40%.

Это происходит довольно быстро, и, поскольку это производственная система, у нас не так много времени, чтобы просмотреть файловую систему, чтобы увидеть, какие файлы являются новыми. Есть также пара монтирований NFS, которые вызывают du -sh * повесить. Мы используем RHEL 6.7.

Есть ли умный способ выяснить, что именно заполняет диск? Возможно, это быстрый способ захвата, сравнения и агрегирования размеров файлов из lsof? Я полагаю, что это довольно распространенный сценарий, поэтому он может быть хорошим awk однострочник, который есть в наборе инструментов каждого системного администратора.

Это событие выглядит как 8 минут до того, как оно произошло. Это было бы удивительное время отклика, которого следует избегать вручную, особенно если администратор не был в системе, когда она началась.

Вам нужно больше времени на реакцию. Дайте ему больше места, чтобы жевать. Дросселируйте или ограничивайте работу каким-либо образом.

iotop - хороший скрипт на Python, позволяющий увидеть процессы, выполняющие наибольшее количество операций ввода-вывода. Который, вероятно, содержит вашего беглеца. У него может быть приличный пакетный вывод с правильными параметрами, например iotop -bkto.