Назад | Перейти на главную страницу

Диагностировать, почему сервер вышел из строя

У меня есть пара веб-приложений Asp.Net под управлением Windows Server 2008 R2 VPS. Мы используем этот VPS годами. С последних нескольких месяцев наши приложения отключались на 30-45 минут. Это не происходит периодически и не в одно и то же время суток. Это должно было случиться 4 или 5 раз за последние 2 месяца. Наша аналитика не регистрирует одновременно большое количество пользователей онлайн. У нас было больше пользователей онлайн, и у нас не было проблем.

Во время простоя мы не можем подключиться к VPS через RDP. Новый мониторинг реликвий показывает нулевую активность на любом фронте. После того, как VPS снова подключен к сети, приложения работают нормально. Даже после того, как VPS снова в сети, nwe relic не показывает никаких новых записей за этот период времени. Средство просмотра событий также не показывает никаких записей в период простоя. У нас есть обычные записи в журналах системы / безопасности / приложений, почти по одной в минуту, до момента простоя. И следующая запись начинается после окончания простоя.

Похоже, что за это время наш VPS был усыплен. Я проверил в средстве просмотра событий события с идентификаторами 6005,6008,6009,6013,1072,1074,1076. Я читал в различных сообщениях в Интернете, что эти идентификаторы событий могут помочь идентифицировать запланированные / неожиданные отключения / перезапуски. Я не нашел ни одного для этого временного диапазона.

Что еще я могу сделать, чтобы определить, почему это происходит, и предотвратить это.

РЕДАКТИРОВАТЬ

Этот случай простоя произошел из-за перезагрузки физического сервера хостом. Что касается предыдущих простоев, хозяин утверждает, что не участвовал. Посмотрим. В настоящее время я помечаю сообщение @Greg как принятый ответ, так как до сих пор я не думал об этом.

Обратитесь к своему провайдеру vps. Это может быть аппаратный сбой, проблема с сетью или многое другое. Потеря удаленного подключения предполагает, что проблема находится вне вашего приложения и, вероятно, вне ОС. Ваш поставщик должен быть в состоянии помочь вам диагностировать проблемы ... Если нет, я думаю, вы все равно будете знать, что делать с проблемами надежности.

Что еще можно сделать? Включите ASP.Net Heath Monitoring / Heartbeat с интервалом в одну минуту. Если пульса нет, скорее всего, что-то внешнее по отношению к Windows / IIS / ASP.Net.

Кажется более вероятным, что ваш провайдер услуг вызвал сбой, чем дефект операционной системы, который, скорее всего, не окажет никакого воздействия при использовании нескольких серверов на нескольких хостах / сетях.

Если у вас нет никаких метрик, измерений или соглашения о доступности, вам вряд ли повезет в попытках реконструировать ответ, заставив ОС клиента решать проблемы хостов или сети поставщика VPS.

К сожалению, перемещение приложений в «облако» не может исправить сломанную или дисфункциональную архитектуру или навыки заключения контрактов.