Назад | Перейти на главную страницу

Сервер VM NetWorker теряет жесткий диск каждую ночь

Запуск сервера EMC NetWorker на сервере 2008 R2 с виртуальной машиной sp1, работающей на хосте ESXi. VMDK хранится на машине VNXe вместе с VMDK для всех других серверов виртуальных машин, которыми управляет наша организация. Ни на одной из других виртуальных машин нет этой проблемы:

Каждую ночь во второй половине этой недели, примерно после 21:00, этот сервер теряет жесткий диск. Проверяя системы утром, я обнаружил, что эта машина сидит в приглашении к загрузке после того, как она попробовала PXE, и сообщает, что не может найти загрузочное устройство. Проверяя настройки виртуальной машины, я обнаружил, что к машине не подключен жесткий диск.

Для восстановления достаточно просто назначить системе новый жесткий диск и указать его на существующий VMDK, который все еще находится в хранилище данных, размещенном на VNXe.

Сервер vSphere не сообщает ни о чем неправильном или каких-либо ошибках.

В системном журнале самого сервера нет информации, поэтому я почти уверен, что он понятия не имеет, что с ним произошло.

Проблема началась, когда я начал наращивать резервные копии с помощью системы NetWorker, добавляя новые хосты для резервного копирования. В настоящее время я выполняю резервное копирование только виртуальных хостов с помощью настроенного прокси-сервера VADP, встроенного в сервер NetWorker, вместе с тестовым сервером SQL (также ВМ) с использованием установленного клиента NetWorker, локального для этой машины. Я выполнял резервное копирование самого сервера NetWorker, поскольку в документации отмечалось, что с этим не должно быть проблем, но я отключил это резервное копирование вскоре после обнаружения этой проблемы.

Мне нужно выяснить, как и почему VMDK отключается от сервера NetWorker. Было бы неплохо, если бы кто-то сказал мне об этом прямо, но, возможно, помощь в поиске журналов vSphere, показывающих все, что происходит с системами, была бы хорошей точкой в ​​правильном направлении.

ОБНОВЛЕНИЕ: дополнительные сведения

Резервное копирование виртуальных машин планируется начинать каждую ночь в 21:00.

Из журналов vSphere для этой виртуальной машины:

На основе этого журнала мне нужно проверить следующее:

Я проверю их и сообщу об успехе или неудаче.

Обновление 2: отчет об устранении неполадок

Я обнаружил еще одну вещь: в конфигурации каждого клиента виртуальной машины в NetWorker есть место для записи хоста ESXi, на котором находится виртуальная машина. Когда я передаю виртуальную машину vMotion на другой хост ESXi, это значение не обновляется, даже если в NetWorker включено автоопределение виртуальной машины. Поэтому я обновил это значение в конфигурации клиента виртуальной машины до текущего хоста ESXi. Было бы неплохо, если бы AutoDetect обновлял его самостоятельно.

Итак, чтобы сообщить об устранении неполадок, которые я попробовал вчера:

Во-первых, сегодня утром жесткий диск все еще был подключен, что подтверждает, что проблема, по крайней мере, была вызвана NetWorker. Вчера я отключил все резервные копии и переместил сервер NetWorker на новый хост ESXi. Я также обновил информацию о хосте ESXi, указанную в предыдущем абзаце.

Сегодня я повторно включил большинство резервных копий (оставив системы высокой доступности, такие как SQL и Exchange.

Если сегодня вечером будет извлечен жесткий диск, проблема заключается в конфигурации резервного копирования.

Если жесткий диск НЕ удаляется сегодня вечером, то проблема связана с информацией о конфигурации хоста или с самим хостом.

Обновление 3: дальнейшие действия по устранению неполадок

Жесткий диск снова был потерян прошлой ночью, что означает, что проблема, вероятно, связана с конфигурацией NetWorker.

Напомним: вчера вечером я выполнил запланированное резервное копирование нескольких виртуальных машин (но не сервера NetWorker), и сразу после 21:00 я увидел те же записи журнала, которые я отметил ранее в вопросе, в результате чего больше не было жесткого диска, связанного с ВМ.

Я попробую еще кое-что: согласно документации EMC, сервер NetWorker также может быть узлом хранения, и большинство виртуальных машин обрабатывают свои резервные копии через этот узел (это отдельный от VADP). Я отключу их с помощью резервных копий узлов и посмотрю, имеет ли это значение.

Кроме того, резервные копии физических систем и резервные копии NDMP с наших NAS / сетевых дисков работают нормально.

Я начну изолировать виртуальные машины и добавлять по одной в резервную копию, чтобы посмотреть, могу ли я определить, является ли конкретная виртуальная машина причиной проблемы. Это то, что я могу проверить в рабочее время.

ОБНОВЛЕНИЕ: Тестирование проливает свет

Хорошо, проблема в том, что всякий раз, когда я пытаюсь создать резервную копию виртуальной машины с помощью VADP.

Я тестировал резервное копирование работающих и выключенных виртуальных машин, используя различные изменения настроек, и единственным определяющим фактором того, потерял ли сервер NetWorker свой диск, было то, установил ли я клиент NetWorker на целевой ВМ и выполнял ли резервное копирование с помощью Клиент NetWorker или с помощью VADP.

При настройке резервного копирования с помощью мастера клиента сначала вы выбираете, настраиваете ли вы новый прокси-сервер VADP, или клиента резервного копирования виртуальной машины, или клиента NetWorker.

Если вы выберете клиент резервного копирования виртуальной машины, вы сможете выбрать, выполняете ли вы резервное копирование с помощью VADP (это значение по умолчанию) или с помощью клиента NetWorker, установленного на виртуальной машине (это необходимо, если вам нужны какие-либо особые конфигурации для резервного копирования. VADP обращается фактический VMDK и интегрируется с VMWare. NetWorker по-прежнему «знает», что клиент является виртуальной машиной, но может использоваться для указания конкретных дисков, VSS и других функций. VADP выполняет резервное копирование виртуальных машин без использования каких-либо гостевых ресурсов, полностью полагаясь на хост ESXi • Клиентское программное обеспечение NetWorker использует клиентские ресурсы для выполнения резервного копирования.

Итак, выполнение резервного копирования VADP хоста виртуальной машины - это то, что удаляет жесткий диск с сервера NetWorker. И есть другие записи журнала, которые отображаются в клиенте vSphere при отключении жесткого диска:

Возможно, уже слишком поздно, но это может быть полезно для будущего планирования.

Причина, по которой это произошло. После использования транспортного режима HotAdd для резервного копирования виртуальной машины, которая служит прокси-сервером резервного копирования, резервное копирование завершается успешно, но во время очистки обычный виртуальный диск по ошибке удаляется вместе с диском HotAdded.

В то время была известная проблема с комплектом VDDK - http://www.vmware.com/support/developer/vddk/VDDK-1.2.1-Relnotes.html. При создании среды hotadd очень важно НЕ делать резервную копию прокси с помощью VADP.

Решением было полностью перестроить сервер NetWorker, что было хорошо по нескольким причинам.

Резервное копирование выполняется, и диски сервера NetWorker / прокси VADP не сбрасываются.