Я надеюсь, что ты сможешь помочь ... это скорее проверка вменяемости, чтобы проверить мои мысли в данный момент. У нас есть кластер VMWare, подключенный к высокопроизводительной сети SAN. Все работает хорошо, запустив тесты записи fio, я могу получить IOPS ~ 60k. Итак, я настраивал машину в этой среде с 16 ГБ ОЗУ и 10 виртуальными ЦП. Пока все хорошо ..
Затем я попытался выполнить rsync файла размером около 48 ГБ из удаленного источника на этот компьютер, и, когда скорость передачи увеличилась примерно до 20 МБ / с, я быстро заметил, что виртуальная машина получателя замедляется, а загрузка быстро увеличивается до такой степени, что машина стал совершенно нестабильным и непригодным для использования. Пытаясь отследить путь этой проблемы, я вошел в хост ESXi этой машины и запустил esxtop. То, что я увидел, было совершенно неожиданным -
Для рассматриваемой виртуальной машины было 31 запись / с с задержкой записи 1496,4 мс!
Однако, глядя на сами диски, кажется, что они не испытывают большой нагрузки?
Итак, я предполагаю вопрос на миллион долларов, почему вы думаете, что это может происходить, во-вторых, каким-либо способом я могу дополнительно диагностировать проблему и в-третьих, это ненормально, верно ?!
Задержка может быть вызвана подготовкой диска в виртуальной машине. Дважды проверьте и сеть, и диск. Я бы порекомендовал тип подготовки с расширенным набором данных Eager Zeroed, чтобы избежать операций READ-> MODIFY-> WRITE (которые используются по умолчанию как для тонкого, так и для ленивого обнуления). Обычное READ-> WRITE может уменьшить задержку.
Не могли бы вы предоставить больше информации о сети? Также проверьте латентность сети.