Назад | Перейти на главную страницу

Странные проблемы с производительностью виртуальной машины Azure

У нас есть 5 виртуальных машин в Azure для клиента. Все виртуальные машины работают без сбоев.

Теперь с понедельника виртуальная машина одного из пользователей теряет производительность каждый день в 16:00 UTC + 1 (+ -1ч). Когда у нас возникают эти проблемы с производительностью, процессор случайным образом работает со скоростью около 100%.

Все остальные виртуальные машины работают без сбоев, а программный стек одинаков на всех виртуальных машинах.

Мы связываемся со службой поддержки Microsoft более 24 часов. Тем временем мы дважды развертывали виртуальную машину: один раз из моментального снимка, а второй раз полностью с нуля. Тем не менее, проблема возвращается.

Все остальные виртуальные машины работают в тех же условиях при 5-30% ЦП.

Проблема вообще не воспроизводится. Это просто приходит и уходит по несколько часов.

Сейчас у нас есть четыре опытных инженера, и мы не можем решить проблему.

Вы хоть представляете, что это может быть? Я рад любому вкладу. Мы тут скоро сойдем с ума ...

Что мы запускаем на машинах:

Что мы уже сделали, чтобы выяснить / исправить проблему:

Я отредактирую здесь, когда вспомню, что мы пробовали

Благодаря нашим прекрасным друзьям из Reddit я смог найти решение этой проблемы. Итак, мы запускаем Burstable VM (B-Series), и мне было указано, что у них есть «пакетная квота с течением времени».

Покопавшись в этом, я смог обнаружить, что эта подсказка была идеальной по деньгам. Я знал, что эти виртуальные машины можно наращивать, но я не знал, как это можно измерить или ограничить.

После долгих поисков и проверки предположений с использованием монитора Azure с показателями процента ЦП и метрики «Оставшиеся кредиты ЦП» на всех виртуальных машинах выяснилось, что кредиты ЦП заканчиваются, поэтому ЦП был ограничен 40% до либо нагрузка уменьшена, либо кредиты накоплены.

При остановке и освобождении виртуальной машины кредиты будут сброшены до базового уровня, и кредиты никогда не использовались до тех пор, пока заказчик не завершил работу над ней.

Большое спасибо за то, что направили меня в правильном направлении, это избавило нас от многих дальнейших проблем.

Теперь мы увеличили размер на единицу, и он работает отлично, и кредиты никуда не уходят.

Это только начинало происходить на этой неделе, так как у нас было задание резервного копирования, выполнявшееся в понедельник и вторник, поэтому загрузка ЦП была выше около полудня, когда началось резервное копирование, и это привело к снижению кредитов около 16:00.

В оставшуюся часть недели усиленный мониторинг и попытки спровоцировать проблему с увеличением использования заставили проблему повториться снова, но с задержкой.

Также в процессе аналитики мы поняли, что этот конкретный пользователь просто делал немного больше сразу, поэтому ЦП чаще выходит за пределы базового уровня ЦП, что еще больше снижает ЦП.

Примерно через два часа после того, как мы это выяснили, Microsoft пришла к такому же выводу.

Спасибо всем за их вклад, особенно пользователю Reddit / u / VTi-R, я очень ценю это!

Вы можете перейти и узнать больше о виртуальных машинах серии B здесь https://azure.microsoft.com/de-de/blog/introduction-b-series-our-new-burstable-vm-size/