Назад | Перейти на главную страницу

Что может вызвать тайм-аут моментального снимка VMWare?

Я использую BackupExec и VCB для резервного копирования нескольких виртуальных машин. Насколько я понимаю, сценарий перед заданием создает моментальный снимок моих виртуальных машин, монтирует их как виртуальные каталоги на моем сервере резервного копирования, а затем мое задание резервного копирования выполняет резервное копирование локальных папок, как обычно. Проблема, с которой я сталкиваюсь, возникает во время сценария перед выполнением задания, и каталог для одного конкретного сервера никогда не монтируется.

Когда я смотрю на VI-клиент и просматриваю недавнюю активность, я вижу, что моментальный снимок начался, но еще не закончился. Похоже, что время ожидания истекает через 15 минут, поэтому резервное копирование сервера никогда не выполняется.

У меня есть резервное копирование нескольких виртуальных машин, а остальные работают нормально. У проблемной виртуальной машины есть виртуальный диск размером 85 ГБ, однако у другой виртуальной машины, которая действительно работает, виртуальный диск составляет почти 100 ГБ.

Мне интересно, что еще в виртуальной машине может привести к тому, что создание моментального снимка займет много времени. Возможно, это проблема с хостом виртуальной машины? Хост виртуальной машины - очень мощный сервер, и ни одна из гостевых виртуальных машин не используется интенсивно, а резервное копирование выполняется в нерабочее время, поэтому не должно быть случаев, когда сервер просто перегружен. Есть ли какие-нибудь журналы или инструменты, которые я могу использовать, чтобы узнать, что замедляет создание снимка?

VMWare использует термин снимок довольно свободно. На самом деле он не создает копию вашего сервера, он просто прекращает вносить какие-либо изменения в существующий дисковый файл и перенаправляет изменения в файл дельты на всю жизнь снимку.

Это значит:

  1. моментальные снимки на сервере любого размера практически мгновенны.
  2. пока сохраняется моментальный снимок, дельта-файл будет продолжать расти - возможно, до такой степени, что будет израсходовано все базовое дисковое пространство.
  3. фиксация изменений (т.е. удаление снимка) может занять некоторое время

Я думаю, что процесс VCB делает снимок (чтобы данные не менялись во время копирования), а затем делает клон замороженного файла для резервного копирования. Это может занять некоторое время - хотя вы упомянули, что это подходит для более крупного сервера, поэтому, вероятно, это не проблема.

Одна из возможностей - если у вас есть виртуальные диски, помеченные как независимый. Если так, они игнорируются снимок процесс, а также, возможно, VCB. Не знаю, как VCB монтирует диски, но, возможно, для этого требуется диск, помеченный как независимый?

Сколько виртуальных машин вы размещаете на одном LUN? Насколько они заняты?

У нас возникли серьезные проблемы с некоторыми серверами VMware ESX, которые размещали столько резервов SCSI на LUN, что другие серверы ESX, использующие тот же LUN, больше не могли писать в LUN. Однако вы должны увидеть это в файлах журнала.

ESX устанавливает резервирование SCSI для всего LUN, когда он прекращает обновление метаданных. Возможно, что VCB добавит здесь немного к и без того большой нагрузке на LUN.

Официально эта проблема исправлена ​​в течение нескольких месяцев, но время от времени возникают проблемы.

Когда это происходит, проверьте задержку на вашем san. Возможно, другой виртуальный компьютер или процесс (задание sql-сервера?) Одновременно обращается к san.

Задержка и резервирование SCSI уже упоминалось, и это часто является причиной.

Что еще нужно проверить:

Правильно ли установлены и работают ваши vmtools на этой конкретной виртуальной машине? На виртуальной машине установлена ​​устаревшая версия vmtools? Инструменты VMware - ключ к созданию хорошего снимка. Например, более поздние версии ESX 3.5 и инструменты vmware поддерживают использование VSS в качестве поставщика моментальных снимков для виртуальных машин Windows, но обновленная версия инструментов vmware должна быть установлена ​​с поддержкой VSS и должна быть настроена.

Ресурс резервного копирования: стоит ли это конкретное задание в очереди в течение длительного периода времени? Если используется этап диска или ленточный накопитель, а задание остается на этапе создания моментального снимка в течение длительного периода времени, моментальный снимок может никогда не быть выполнен. Это кажется маловероятным, учитывая ваше описание, но в целом это может быть что проверить.

Другое дело, убедитесь, что дефрагментация никогда не запускается, пока есть снимок виртуальной машины. Дельта-файл просто взрывается в размерах.