из-за мертвого порта нас заставили заменить наш Linksys / Cisco SR2016 в центре обработки данных.
Поэтому мы посмотрели на складские запасы нашего поставщика, и единственным интересным коммутатором, который у них был, был коммутатор Cisco SLM2024 Smart - и мы его получили.
Я пошел в центр обработки данных, настроил (установил IP) и заменил коммутатор в субботу вечером, и с тех пор у нас с ним возникают большие проблемы. В большинстве случаев он работает нормально, но время от времени он падает на 1-20 минут, что приводит к потере около 90% пакетов для всех подключенных серверов - и когда все в порядке, коммутатор работает полностью нормально.
Другой коммутатор, который у нас есть, это Linksys / Cisco SRW2016, и если я переключу все кабели с SLM2024 на этот SRW2016, все будет работать нормально ... Я почти уверен, что петель не было.
Кабель восходящей связи идет к коммутатору семейства Catalyst 37xx ...
Я спросил у техподдержки теледома, не было ли у них подобных проблем в прошлом, но они говорят, что нет - и я хотел бы быть полностью уверен, что проблема в коммутаторе, прежде чем я верну его поставщику (потому что я не совсем уверен, как мне это продемонстрировать).
Спасибо за ваше мнение!
Если вы проверите статистику связующего дерева на коммутаторе, которая должна рассказать вам больше о возможности петли, поищите возраст топологии. Когда возникает петля, топология постоянно перестраивается, чтобы компенсировать петлю, поэтому более высокий возраст топологии (5 часов или более) указывает на отсутствие петель в сети.
Я видел некоторые проблемы с сетевыми адаптерами серии Broadcomm pro и моими коммутаторами Alcatel, которые очень похожи на те, с которыми вы сталкиваетесь. Это было очень прерывисто и неприятно, пока я не узнал, что на самом деле это было автосогласование на коммутаторе.
Я решил это, отключив функцию autoneg и жестко закодировав скорость и дуплекс для всех портов. Это действительно лучшая практика в серверной среде, в любом случае я просто поленился и решил, что позволю autoneg справиться с этим.
Еще вы можете сделать захват пакета в сегменте и посмотреть, не появляются ли у вас кадры сброса или ошибки последовательности.
Также посмотрите на настройки управления потоком на переключателе.
То, что вы описываете, похоже на петлю. Я бы сначала дважды проверил кабели. Помимо петли или самого коммутатора, которые являются проблемой, вы можете также посмотреть, какие порты пропускают через них наибольший трафик, и перейти оттуда, чтобы выследить устройства на этих портах. Вы также можете попробовать запустить Wireshark на одном из серверов, испытывающих потерю пакетов, чтобы увидеть, что сервер видит в сети во время сбоя.
Вы наблюдаете потерю пакетов "между серверами на коммутаторе" или потерю пакетов "между серверами на коммутаторе с одной стороны и внешними серверами с другой, но между локальными серверами нет проблем между собой"?
Если это последнее, я бы начал с жесткой настройки скорости и дуплекса на обоих концах восходящего канала. Или, по крайней мере, убедитесь, что он прибит (или автоматически согласован) с обоих концов.