Назад | Перейти на главную страницу

Виртуальные серверы перезапускаются случайным образом только ночью - идентификатор события 41

У меня есть два связанных виртуальных сервера под управлением Windows Server 2012:

  1. Сервер базы данных с Microsoft SQL Server Express
  2. Сервер приложений, на котором запущен Tomcat, и относительно легкое приложение.

Оба сервера по 4 ГБ.

Оба они загадочным образом перезапускаются с идентификатором события 41 без создания файла MiniDump. Перезапуск происходит примерно раз в две недели и случается случайно ночью. Для наших пользователей необычно использовать приложение ночью, и единственная фиксированная вещь, которая происходит ночью, - это резервное копирование базы данных в 5 утра (и большинство перезапусков происходит до этого).

Облачная компания начала расследование и не нашла ничего неправильного. Они обновили VMWare. Их единственное предложение - увеличить ресурсы серверов.

Они также утверждают, что проблема не в оборудовании, во-первых, потому что это облачная система, а во-вторых, потому что другие клиенты не жалуются.

В Сервер виртуальной машины загадочно перезагружается предполагается, что установка повреждена. Однако я бы предположил, что в нашем случае это могло быть не причиной. (1) наличие одной и той же проблемы на обоих серверах было бы немного случайным - если, конечно, они оба не были установлены неправильно (2) это не объясняет, почему перезапуск происходит ночью.

Любые идеи?

ОБНОВИТЬ

  1. Один сервер не подключен к Интернету, поэтому вопросы DDOS не актуальны.
  2. Аварии случаются совершенно случайно, но всегда ночью.

  3. Я разместил образец журнала системных событий по адресу http://textuploader.com/d9opz - до 2 часов ночи ничего интересного не произошло. Катастрофа произошла около 2:17 ночи.

  4. Я не знаю каких-либо конкретных запланированных задач, которые происходят ночью.

  5. Перемещение виртуальных машин на данный момент не вариант, хотя вот немного больше информации: они работают на VMWARE и являются виртуальными серверами, работающими в отдельных VLAN.

  6. У нас есть виртуальный тестовый сервер, который запускает обе сервер приложений и сервер БД (и имеет очень похожую настройку), которые, похоже, не имеют никаких проблем.

Облачная система - это просто система, которая работает на чужом оборудовании. На узле, на котором запущена виртуальная машина, все еще может быть проблема с оборудованием.

Если, например, у хоста есть один сбойный блок памяти, эти два хоста могут постоянно обращаться к этому блоку. Тем более что один из серверов - это база данных.

У вас есть другие виртуальные машины на том же хосте? Если нет, можете ли вы временно переместить один из них туда, а этих двух - на другой хост? Это может помочь вам изолировать проблему. Хост также должен создавать журналы, если это возможно. Обратитесь в компанию, чтобы убедиться, что они контролируют его с хоста и создают журналы.

Сначала я бы начал с создания задачи монитора производительности, основанной на использовании ЦП / ОЗУ и HD. Это может помочь исключить утечки памяти, скачки загрузки ЦП (возможно, дампы журнала раз в две недели и т.п.) или ошибки записи на диск.

Кроме того, вы можете попробовать проверить BlueScreenView, чтобы убедиться, что это BSOD.