Назад | Перейти на главную страницу

Соответствующие инструменты мониторинга сети для регистрации сбоев

У меня есть клиент, у которого время от времени возникают сбои в работе нашего программного обеспечения. К сожалению, если вы отключите сетевой кабель в середине транзакции, наше программное обеспечение будет давать сбой каждый раз, и с этим ничего нельзя поделать (или, по крайней мере, никогда не будет).

Я считаю, что их сеть время от времени испытывает сбои, которые вызывают сбои программного обеспечения, но я не уверен, как это доказать (мой опыт - программирование и базы данных, но не сети).

Когда я пингую любую из клиентских машин с сервера, все они отвечают менее чем за миллисекунду, но всякий раз, когда он выходит из строя, мы можем найти какое-то сообщение об ошибке в журнале событий о потере соединения с файлом (извините, я знаю, что это действительно расплывчато но я сам еще не был на сайте и человек, который зашел, не записал).

Я действительно не уверен, как проводить тестирование чего-то подобного, чтобы даже знать, какие сетевые инструменты мне следует искать. Если бы кто-то мог указать мне правильное направление, я был бы очень признателен!

Копчение - довольно удобный инструмент для мониторинга, если вам интересны только потеря пакетов и задержка.

Если это не соответствует требованиям, этот вопрос возможно, у вас есть несколько интересующих вас ответов.


Чтобы было ясно: устранение неполадок такого рода может быть чрезвычайно затруднительным. Скорее всего, инструменты мониторинга не дадут вам никакой полезной информации. Наиболее вероятный инструмент, который следует использовать для отслеживания этого, - это захват пакетов. Возьмите один как на клиенте, так и на сервере, а затем сопоставьте временные метки с моментом сбоя приложения клиента, а также, возможно, с данными из Smokeping (или любого другого инструмента мониторинга, который вы выберете).

Если рассматриваемая клиентская машина находится на приличном управляемом коммутаторе, сетевой инженер должен быть в состоянии сказать вам, не работает ли сетевой порт машины вообще. Плохие кабели, нестабильные сетевые адаптеры, плохие порты на коммутаторе, проблемы с драйверами - все это может привести к сбоям в работе самого сетевого порта.

Проверьте журналы событий Windows на клиентском компьютере в указанное время. Создайте настраиваемое представление в средстве просмотра событий, которое содержит все журналы событий с настраиваемым периодом времени вокруг сбоя, что позволит вам увидеть все, что Windows заметила в течение этого периода времени.

Вы можете настроить пинг от сервера к клиенту с небольшим интервалом - скажем, два раза в секунду - и позволить ему работать в фоновом режиме, пока не возникнет проблема. Зарегистрируйте вывод в файл, чтобы не потерять результаты.

Если вы собираетесь попытаться сопоставить журналы на нескольких машинах, убедитесь, что их часы относительно синхронизированы.