Назад | Перейти на главную страницу

Корреляция% RDY в esxtop с использованием ЦП в гостевой системе

Недавно мы обновили ряд наших хостов VmWare с 4.1 до 5.5 и заметили, что на многих виртуальных машинах наблюдается ступенчатый скачок использования ЦП, как показано на гостевой виртуальной машине. Мы еще не обновили vmwaretools ни на одном из гостей, но после небольшого исследования мы увидели, что многие из этих гостей имеют высокий %RDY значение (> 50%) при просмотре под esxtop. К сожалению, Linux (гость) просто показывает "высокую загрузку ЦП" без какого-либо понимания того, какая часть этого исходит от %RDY (VmWare говорит: «Ваш гость ожидает процессора от хоста»). Есть ли инструменты, /proc записи и т. д., которые могут пролить свет на эту информацию?

Вы можете получить информацию о хосте в своей виртуальной машине, если вы установите tools.guestlib.enableHostInfo=TRUE в расширенных настройках ваших виртуальных машин. Возможно, вам также придется установить Misc.GuestLibAllowHostInfo=TRUE в расширенных настройках ваших хостов, но я не уверен в этом.

Я не знаю, работает ли это и для гостей Linux, поскольку VMware явно говорит о Windows:

vSphere включает счетчики производительности виртуальных машин в операционных системах Windows, где установлены инструменты VMware.

Убедитесь, что отправка данных о производительности хоста гостям отключена

Вероятно, это не предоставит виртуальной машине% RDY, по крайней мере, это не упоминается в Вопросы безопасности при настройке инструментов VMware.

Я думаю, что в планировщике были изменения около 5.0 или 5.1. ESXi более агрессивно пытается использовать локальность данных. Если есть свободные ядра, планировщик не будет запускать там виртуальную машину, если память виртуальной машины находится в другом узле NUMA. Что ж, рано или поздно это произойдет, но позже, чем в 4.x, что может быть причиной более высоких значений% RDY. (Извините, но у меня нет ссылки на это.)

Тем не менее: действительно ли это проблема? Вы говорите только об использовании ЦП (в гостевой системе) и времени готовности (в гипервизоре), но не упоминаете производительность вашего приложения. Ухудшилось ли оно с обновлением, улучшилось или осталось прежним? Если бы он не ухудшился, я бы не стал сильно беспокоиться об использовании процессора / времени готовности.

Вместо того, чтобы пытаться раскрыть время готовности и аналогичную информацию вашим гостям, вам следует выяснить, почему время готовности вашего процессора велико.