Назад | Перейти на главную страницу

Как восстановиться после потери питания на сервере OVM

У нас произошла ошибка ИБП и пропало питание на физическом сервере, на котором размещено около 10+ виртуальных машин, использующих платформу Oracle VM. Мы восстановили его и запустили, но мне интересно, как лучше всего оправиться от этого. В частности, мне интересно, нужно ли нам запускать fsck на каждой отдельной виртуальной машине и / или следует ли запускать fsck на уровне платформы? Наш сисадмин недавно уволился, а я больше программист, чем системный администратор, так что это немного выше моего понимания. Я просматривал документацию OVM (OVM Manager 3.2.1), но, похоже, не могу найти ничего конкретно о работе с такого рода ситуациями. Я благодарен всем, кто может указать мне правильное направление.

В идеале вам следует fsck файловые системы каждой виртуальной машины. Для этого вам следует запустить виртуальную машину в однопользовательском режиме или загрузиться по сети или с образа компакт-диска. Если вы хотите загрузить виртуальную машину в однопользовательском режиме, выполните следующие действия:

  1. Войдите на виртуальный сервер как root.
  2. Найдите файл конфигурации виртуальной машины. Обычно я ищу имя виртуальной машины с помощью grep:

    grep -r vm_name /OVS/Repositories/*
    
  3. Запустите виртуальную машину вручную с помощью инструментов Xen, а не из OVM Manager, подключившись к консоли:

    xm create -c <path_from_above>
    
  4. Когда GRUB появится меню, отредактируйте параметры загрузки. Вы не сказали, в каком дистрибутиве работают ваши виртуальные машины, но, предполагая что-то вроде RHEL (RHEL, CentOS, OEL), я бы удалил параметры rhgb и quiet и добавить single console=xvc0. В single опция указывает init запустить однопользовательский режим, console=xvc0 говорит ядру использовать xvc0 как консольное устройство. Это консоль Xen, доступ к которой осуществляется через Oracle VM Manager.

После загрузки в однопользовательском режиме вы можете fsck файловые системы. тем не мение ты не должна попытаться выполнить fsck корневую файловую систему или любые другие смонтированные файловые системы. Файловые системы пользователей / данных можно безопасно проверять, если они отключены. Вы можете запустить fsck -n чтобы проверить корневую файловую систему на наличие ошибок. Если это сообщает об ошибках, вам следует загрузить виртуальную машину по сети или с компакт-диска и запустить fsck оттуда, чтобы файловая система не монтировалась.