Недавно столкнулся с ситуацией, когда «стандартный» мониторинг дискового пространства не удался - Zabbix использует vfs.fs.size элемент для проверки использования диска, который задокументирован и предварительно настроен в связанных шаблонах.
Когда файлы удаляются, но дескриптор файла / дескриптор все еще открыт - диск может быть заполнен, но в этом случае Zabbix не сообщит об использовании.
Как в этом случае контролировать дисковое пространство?
Вот тест, который я сделал:
df /
Filesystem 1K-blocks Used Available Use% Mounted on
/dev/sda1 15350768 14367976 809124 95% /
Я создаю файл 600Мб и открываю его с меньшими затратами:
dd if=/dev/zero of=test bs=1024k count=600 & less test
[1] 1952
"test" may be a binary file. See it anyway? 600+0 records in
600+0 records out
629145600 bytes (629 MB) copied, 11.895 s, 52.9 MB/s
[1]+ Done dd if=/dev/zero of=test bs=1024k count=600
Теперь df покажет, что используется больше места:
df /
Filesystem 1K-blocks Used Available Use% Mounted on
/dev/sda1 15350768 14981664 195436 99% /
теперь, если я удалю свой тестовый файл:
rm test
df говорит:
df /
Filesystem 1K-blocks Used Available Use% Mounted on
/dev/sda1 15350768 14981712 195388 99% /
так что пространство все еще используется, мы можем увидеть его с удаленным lsof | grep:
lsof |grep deleted|grep test
less 1953 mick 4r REG 8,1 629145600 5407 /tmp/test (deleted)
теперь, если я остановлюсь меньше:
pkill less
df показывают, что диск используется бесплатно:
df /
Filesystem 1K-blocks Used Available Use% Mounted on
/dev/sda1 15350768 14367584 809516 95% /
Я думаю, ваша проблема больше связана с неправильной интерпретацией df из-за процента, зарезервированного для root.
Из последнего df общий минус использованный минус доступный равен:
15350768-14367584-809516=173668
Так что, возможно, у вашего пользователя ошибка переполнения диска, но root все еще может писать на диск, и Zabbix не увидит, что диск заполнен из-за процента, зарезервированного для root.
Вы можете проверить и изменить это с помощью tune2fs