Назад | Перейти на главную страницу

Устранение неполадок при случайном зависании сервера без записей в журнале

У нас возникла очень конкретная и уникальная проблема в нашем приложении C #, которое работает под .NET framework 4.7.2, в режиме киоска в операционной системе Windows 10, которая работает на Lenovo ThinkStation P320 Tiny в качестве оборудования (такая же проблема была обнаружена на различное оборудование).

Описание окружающей среды:

сценарий включает постоянно работающее приложение с автоматическим включением / выключением режима день / ночь.
Когда приложение не находится в режиме видеозвонка, оно воспроизводит непрерывный цикл некоторых видео / фильмов.
Приложение запускается в Windows именно в режиме киоска при запуске системы. К мини-ПК (Lenovo) подключаются следующие периферийные устройства:

Единственно возможное взаимодействие пользователя с системой осуществляется в контролируемой среде с помощью сенсорного планшета.

Описание проблемы :

Очевидно, случайным образом мы наблюдаем своего рода зависание машины:
основной и дополнительный мониторы включены с фиксированным изображением, сетевой интерфейс не отвечает на команду ping.
Операционная система в этот период времени не отслеживает выполнение (нет сбоев в журнале системных событий, нет дампа, нет активного процесса).
Даже подключив мышь и клавиатуру к мини-ПК, невозможно восстановить контроль над операционной системой.
Нет точного момента, когда эта проблема начала проявляться, поскольку мы начали этот проект несколько месяцев назад.
Та же проблема возникала и на разных моделях оборудования, отличном от оборудования Lenovo ThinkStation P320 Tiny, используемого в качестве целевой.

Мы безуспешно пытались включить журналы системных событий в программе настройки Lenovo BIOS Setup, но не обнаружили никаких ошибок.
Мы попытались принудительно создать дамп из Windows, но операционная система не может этого сделать.
Мы привлекли поставщика Lenovo (даже если на самом деле проблема также возникает на другом оборудовании), выполнив диагностические инструменты, которые могут выявить любую несовместимость оборудования или внутренние проблемы нашей компании.
Конфигурация: проблем не обнаружено.

В этой ситуации единственная возможность - снять блок питания мини-ПК.
При перезагрузке, анализируя приложение и системные журналы, ничего не обнаруживается в течение периода времени, в течение которого мини-ПК был заблокирован (заморожен), никаких проблем не обнаруживается в период непосредственно перед зависанием или после перезапуска.

Вопрос:

Учитывая, что ни с точки зрения приложения, ни с точки зрения операционной системы невозможно получить информацию о диагностике системы и анализе проблем, мы хотели бы понять, как устранить проблему или включить низкоуровневые журналы или дампы, которые могут расскажите нам больше о статусе мини-ПК, когда он зависает, или о возможных причинах его возникновения.

Если программное обеспечение не может зарегистрировать проблему, то она определенно связана с аппаратной неисправностью. Обычно проблемы взаимодействия драйвера и программного обеспечения вызывают ядерную панику (BSOD).

Что нужно проверить:

  • Аппарат перегревается? (Убедитесь, что в киоске хороший воздушный поток)
  • Есть ли проблемы с источником электричества? (Отсутствует заземление, падения и скачки напряжения? Используйте ИБП, чтобы сгладить подачу питания. Для устранения замыканий на землю вызовите электрика.)
  • Неисправный или дешевый блок питания. (Это может произойти на нескольких устройствах, использующих один и тот же блок питания. Проверьте блок питания.)
  • Рядом большой источник электромагнитных помех? (Пример: аппараты МРТ, катушка Тесла)
  • Ошибка BIOS. (Может существовать на всех устройствах с определенной прошивкой. Проверьте наличие обновлений.)