Сегодня днем, без каких-либо изменений в сети, коммутатор внезапно начал отключать большое количество соединений. Эти соединения восстановятся через несколько минут, затем отключится другая область, подключенная к коммутатору. Это более старый коммутатор шасси 4006, который сам по себе может быть проблемой, но я хочу посмотреть, что еще вы все искали бы, пытаясь найти основную причину.
Коммутатор подключен через порты 1/1 и 1/2 в эфирном канале к ядру VSS 1/1/42 и 2/1/42. Обе стороны включены и работают, однако ЦП на коммутаторе вырастет до 99%, и именно тогда ошибки CRC начнут попадать в ядро VSS на одном из этих интерфейсов, и конечные точки начнут отключаться. Мы пробовали новые трансиверы и SFP на каждой стороне канала, результат тот же. Когда мы пытались поменять местами оптоволоконные соединительные кабели на коммутаторе доступа, ошибки CRC не следовали за оптоволоконными кабелями, они остались с портом 1/2 на коммутаторе доступа. Таким образом, порт 1/2 на модуле супервизора выглядит как виновник. На самом деле мы пытались создать нового члена канала Ethernet, перенеся оптоволоконный медиаконвертер на cat5 и сделав его членом порта-канала, но когда мы подключили его, вы даже не смогли добраться до коммутатора. Я предполагаю, что это не связано и проблема с медиаконвертером.
На данный момент мы оставили его в состоянии только одного оптоволоконного кабеля, идущего к одной стороне ядра VSS (коммутатор доступа 1/1 -> 2/1/42). Я отправил некоторую информацию в TAC, и они изучают ситуацию, но есть ли у кого-нибудь еще какие-либо команды, которые я мог бы запустить, или какие-то способы устранения неполадок, которые я мог бы изучить тем временем?
Скачки ЦП такой величины обычно являются либо своего рода событием связующего дерева (читай: цикл), либо чрезмерным трафиком, попадающим в плоскость управления (чаще всего широковещательные / многоадресные штормы).
Подключен ли 4006 к каким-либо другим нижестоящим коммутаторам? Есть ли вероятность того, что этот 4K будет случайно перекрестно подключен к другому коммутатору?
Вы строите график трафика на этих портах коммутатора? Ищите радикально более высокий уровень трафика. TAC также собирается выяснить, какой процесс потребляет весь этот процессор - каковы основные потребители от show proc cpu
? Вы также видите высокую загрузку ЦП на 4K?
Точно так же есть необычные системные журналы в те моменты, когда вы видите высокую загрузку процессора? Какие-либо изменения (в сети или хостах) в то время, когда все это началось? На более простом уровне, как выглядят конфигурации каналов портов с обеих сторон LACP? Статический? Неправильная конфигурация в этой области может вызвать некоторые проблемы.