Мы управляем примерно 350 серверами в нескольких разных шкафах. Иногда за определенный период времени мы теряли 10% пингов и падений сессий со всей кабиной. Совершенно очевидно, что с серверами проблем нет, потому что проблема начинается со всех серверов в шкафу одновременно и заканчивается снова в одно и то же время. (Мы ведем мониторинг серверов с выделенным сервером в одном шкафу)
В дополнение к этому мы считываем 80 Мбит трафика, что, по нашему мнению, не является естественным. Но что интересно, после полуночи, когда трафик должен быть около 20 Мбит, мы читаем 80 Мбит, когда возникает эта проблема, и в полдень мы снова читаем 80 Мбит, когда эта проблема возникает, когда нормальный трафик должен быть около 60 Мбит.
DC сообщает, что с их маршрутизатором, коммутатором и т. Д. Проблем нет. Они говорят, что у серверов есть проблемы, но когда мы проверяем серверы, нагрузка близка к 0 или 0,5.
Так что мы застряли в этом, они не принимают и даже не комментируют эту проблему. Нам действительно нужен хотя бы комментарий по этому поводу, и мы считаем, что это истинное место для этого вопроса. Надеюсь, вы даже прокомментируете это.
Обновление (15 июля); Теперь DC сказал мне, что (я не знаю, насколько это глупое объяснение) кабель МОЖЕТ быть подключен к порту 100 Мбит. Я не знаю, остались ли 100-мегабитные порты в каком-либо DC, но это их объяснение. Вот новый график;
большое спасибо
Возможно, что одно из устройств, подключенных к вашему коммутатору в стойке, имеет неисправную сетевую карту, которая периодически становится болтливой (и наводняет сегмент мусором). В качестве альтернативы может возникнуть проблема с коммутатором, несмотря на то, что говорят операторы центра обработки данных, а также может быть, что у вас плохой кабель.
Если возможно, во время высокой потери пакетов проверьте индикаторы на коммутаторе. Большинство коммутаторов будут указывать на аномалию, вызванную неисправным сетевым адаптером, отправляющим искаженный трафик (хотя способ, которым они это делают, сильно различается, обычно индикатор, указывающий на соединение, будет мигать или что-то в этом роде, но в любом случае это будет нечетный) .
Также может быть что-то еще, затопляющее много трафика; рассмотрите возможность запуска tcpdump или чего-то еще, чтобы увидеть, не происходит ли вероятный DoS. Отбрасывание пакетов во время перегрузки сети - нормальное явление.