Мы изо всех сил пытались определить проблему, при которой все наши заказные системы дают сбой хотя бы раз в день. Мы не изменили все наши системы, чтобы определить, что еще изменилось, что приводит ко всем этим сбоям.
Мы также проводим различные тесты и контролируем изменения, чтобы попытаться сузить проблему.
Однако мне было интересно, существует ли инструмент мониторинга серверов Windows, который может дать нам глубокое понимание того, что происходит с ОС, оборудованием и т. Д.? Нам нужно что-то получше стандартных журналов событий, которые на данный момент не очень полезны.
Любое руководство будет очень признательно.
Если бы я был на твоем месте, я бы начал с Монитор процесса. Он будет отслеживать весь доступ к файлу, сети и реестру со стороны данного приложения (например, открытие данного файла, чтение из файла, открытие ключа реестра, запись данных в этот ключ и т. Д.). Затем вы можете просмотреть журналы, сгенерированные таким образом, чтобы увидеть, какова непосредственная причина сбоя, и продолжить работу оттуда.