У меня есть два связанных виртуальных сервера под управлением Windows Server 2012:
Оба сервера по 4 ГБ.
Оба они загадочным образом перезапускаются с идентификатором события 41 без создания файла MiniDump. Перезапуск происходит примерно раз в две недели и случается случайно ночью. Для наших пользователей необычно использовать приложение ночью, и единственная фиксированная вещь, которая происходит ночью, - это резервное копирование базы данных в 5 утра (и большинство перезапусков происходит до этого).
Облачная компания начала расследование и не нашла ничего неправильного. Они обновили VMWare. Их единственное предложение - увеличить ресурсы серверов.
Они также утверждают, что проблема не в оборудовании, во-первых, потому что это облачная система, а во-вторых, потому что другие клиенты не жалуются.
В Сервер виртуальной машины загадочно перезагружается предполагается, что установка повреждена. Однако я бы предположил, что в нашем случае это могло быть не причиной. (1) наличие одной и той же проблемы на обоих серверах было бы немного случайным - если, конечно, они оба не были установлены неправильно (2) это не объясняет, почему перезапуск происходит ночью.
Любые идеи?
ОБНОВИТЬ
Аварии случаются совершенно случайно, но всегда ночью.
Я разместил образец журнала системных событий по адресу http://textuploader.com/d9opz - до 2 часов ночи ничего интересного не произошло. Катастрофа произошла около 2:17 ночи.
Я не знаю каких-либо конкретных запланированных задач, которые происходят ночью.
Перемещение виртуальных машин на данный момент не вариант, хотя вот немного больше информации: они работают на VMWARE и являются виртуальными серверами, работающими в отдельных VLAN.
У нас есть виртуальный тестовый сервер, который запускает обе сервер приложений и сервер БД (и имеет очень похожую настройку), которые, похоже, не имеют никаких проблем.
Облачная система - это просто система, которая работает на чужом оборудовании. На узле, на котором запущена виртуальная машина, все еще может быть проблема с оборудованием.
Если, например, у хоста есть один сбойный блок памяти, эти два хоста могут постоянно обращаться к этому блоку. Тем более что один из серверов - это база данных.
У вас есть другие виртуальные машины на том же хосте? Если нет, можете ли вы временно переместить один из них туда, а этих двух - на другой хост? Это может помочь вам изолировать проблему. Хост также должен создавать журналы, если это возможно. Обратитесь в компанию, чтобы убедиться, что они контролируют его с хоста и создают журналы.
Сначала я бы начал с создания задачи монитора производительности, основанной на использовании ЦП / ОЗУ и HD. Это может помочь исключить утечки памяти, скачки загрузки ЦП (возможно, дампы журнала раз в две недели и т.п.) или ошибки записи на диск.
Кроме того, вы можете попробовать проверить BlueScreenView, чтобы убедиться, что это BSOD.