у меня есть org.apache.solr.hadoop.MapReduceIndexerTool/MorphlineMapper
процесс, заполняющий локальное монтирование '/'.
Он работает в течение нескольких минут, диск заполняется, срабатывают предупреждения Nagios, а затем я завершаю процесс. Как только процесс завершается, использование файлов снова падает до базового уровня 40%.
Это происходит довольно быстро, и, поскольку это производственная система, у нас не так много времени, чтобы просмотреть файловую систему, чтобы увидеть, какие файлы являются новыми. Есть также пара монтирований NFS, которые вызывают du -sh *
повесить. Мы используем RHEL 6.7.
Есть ли умный способ выяснить, что именно заполняет диск? Возможно, это быстрый способ захвата, сравнения и агрегирования размеров файлов из lsof
? Я полагаю, что это довольно распространенный сценарий, поэтому он может быть хорошим awk
однострочник, который есть в наборе инструментов каждого системного администратора.
Это событие выглядит как 8 минут до того, как оно произошло. Это было бы удивительное время отклика, которого следует избегать вручную, особенно если администратор не был в системе, когда она началась.
Вам нужно больше времени на реакцию. Дайте ему больше места, чтобы жевать. Дросселируйте или ограничивайте работу каким-либо образом.
iotop - хороший скрипт на Python, позволяющий увидеть процессы, выполняющие наибольшее количество операций ввода-вывода. Который, вероятно, содержит вашего беглеца. У него может быть приличный пакетный вывод с правильными параметрами, например iotop -bkto
.