У нас есть кластер ESXi 6.5 с 4 хостами и полностью автоматизированным DRS. При проверке истории мы видим конкретную (большую) виртуальную машину (6 процессоров, 64 ГБ памяти), имеющую примерно 10 vMotions от DRS в день. Кто-то из команды утверждает, что мы должны сделать DRS менее агрессивным и исключить эту большую машину из DRS.
Но мне интересно, какой в этом смысл? Разве мы не можем просто позволить DRS выполнять свою работу, поскольку vMotion не должен влиять на производительность гостевой системы и кластера? Я хотел бы иметь несколько аргументов, чтобы посоветовать ему не усложнять ситуацию, применяя исключения и так далее.
Вы перемещаете десятки ГБ ОЗУ по сети с одного хоста на другой, так что вы ДЕЙСТВИТЕЛЬНО оказывает влияние. Я настоятельно рекомендую снизить агрессивность DRS. Вы ничего не получите, перемещая виртуальные машины 10 раз в день; DRS поможет вам достичь общей сбалансированной нагрузки в кластере, а затем несколько поддержать ее при создании новых виртуальных машин (вы получите рекомендуемый целевой хост). Он также повторно сбалансирует кластер при больших расхождениях между хостами.
vMotions действительно оказывает небольшое влияние на кластер, он съедает немного времени гипервизора и, очевидно, также использует пропускную способность сети, но в целом оставить его включенным имеет смысл, но если вы хотите снизить агрессию, это тоже нормально. Мне интересно, что, учитывая требования к ресурсам виртуальной машины, возможно, ее перемещение на приличное количество означает, что вам нужно больше процессора и / или памяти? Также почему вы еще не перешли на 6.7?
Прежде всего, логика того, почему DRS что-то перемещает, очень сложна, поэтому попытка выяснить, почему он что-то делает, обычно ведет к безумию.
При этом снижение настройки агрессии - это то, что обычно делается, когда DRS слишком легко запускается, если нет какой-либо другой очевидной основной проблемы, например, если виртуальная машина слишком близка к максимальной конфигурации хоста (VMware не очень счастливого кемпера, если вы назначите 90% ресурсов хоста одной виртуальной машине). Настройка агрессии на самом деле не имеет большого значения, DRS все равно сработает, независимо от того, станет ли какой-либо хост слишком перегруженным, очевидно, он просто будет менее агрессивным. Как я уже говорил выше, из-за того, что DRS учитывает так много факторов, настройки агрессии на самом деле не сопоставимы между различными средами, обычно 3 являются хорошей отправной точкой, но в некоторых средах необходимо, чтобы она была понижена на ступеньку или две.
Исключения - это немного другое дело, их лучше всего зарезервировать для виртуальных машин, которые не слишком любезно переносят. Примером может служить программное обеспечение горячего резервирования, которое проверяет, находится ли его одноранговый узел в сети. очень часто я видел приложения, которые начинают отказываться, если горячий одноранговый узел не отвечает более миллисекунды. Еще одно приложение для исключений - это виртуальные машины, которые вы хотите оставить на месте. Хороший пример - это растянутый кластер в нескольких центрах обработки данных. Тогда имеет смысл исключить контроллеры домена из DRS и вручную разместить их на определенных хостах в определенных центрах обработки данных, чтобы DRS не стала слишком умной и поместила их все в один центр обработки данных.