В качестве среды виртуализации мы используем Proxmox VE, недавно обновленную с 2.X до 3.X. Мы также перешли с одного хоста на кластер с двумя хостами. И, наконец, что не менее важно, мы переместили наши виртуальные машины с бэкэнда LVM на сервер GlusterFS.
Вот график, сделанный непосредственно перед миграцией. Обратите внимание на чистые, четкие линии:
Вот тот же график прямо сейчас:
Моя первая мысль заключалась в том, что virt1 не отвечает быстро, поэтому я использовал zabbix_get
чтобы проверить эту теорию, и вот результат:
[root@monit ~]# for i in {1..10}; do (time zabbix_get -s virt1 -k system.cpu.load[,avg1]) 2>&1 | grep -i real | awk '{print $2}'; sleep 1; done
0m0.011s
0m0.015s
0m0.010s
0m0.010s
0m0.010s
0m0.010s
0m0.010s
0m0.011s
0m0.011s
0m0.011s
Результат очень быстрый и, конечно, не где-то рядом с пределом в три целых секунды.
Кроме того, это происходит не на всех хостах, например, на virt1, virt2 и виртуальной машине с именем nas, но не на других виртуальных машинах.
Надеюсь, здесь есть гуру Zabbix, который может помочь.
Спасибо!
ETA:
Вот статистика, о которой говорил Асавельев:
Timestamp Value
2014.Aug.14 09:13:56 17
2014.Aug.14 09:13:27 18
2014.Aug.14 09:12:56 17