Назад | Перейти на главную страницу

Как найти первопричину снижения пропускной способности и увеличения потерь пакетов?

Краткое изложение моей проблемы: Как и почему стабильный сервер может внезапно начать работать хуже в течение нескольких дней, а затем (по-видимому, автоматически) вернуться в нормальное состояние?


Я провожу тестирование производительности над сервером VPN. Настройка в основном следующая:

Клиент (Linux) подключается к VPN-серверу, который, в свою очередь, направляет трафик на / от узла во «внутренней» сети (также Linux).

Коротко о тесте: На внутреннем узле (linux) выполняю команду

iperf -s -p 111 -u

Затем на клиенте я выполняю

iperf -t20 -c<internal ip> -p 111 -l1000 -b100M -u

Эти тесты обычно обеспечивают пропускную способность около 40 Мбит / с с потерей пакетов ~ 0% на постоянной и регулярной основе. Т.е. с использованием той же аппаратной настройки (с небольшими изменениями программного обеспечения для клиент-серверной части) эти тесты проходили более 100 дней подряд. Однако за последнюю неделю пропускная способность снизилась примерно на 10% в день, а потеря пакетов увеличилась примерно на 10% в день.

Я запускал различные варианты тестов iperf (различные параметры и т. Д.), Выполнив следующие действия:

Ничего из этого не подействовало.

Однако внезапно все заработало. Прогон имел скорость 20 Мбит / с с потерей пакетов 60%, и все последующие прогоны «вернулись в норму». Обратите внимание, что это произошло через несколько часов после замены оборудования / программного обеспечения и выполнения вышеуказанного теста примерно 100 раз.

С тех пор я восстановил аппаратное и программное обеспечение до их первоначальных настроек, повторил тесты примерно в 100 раз больше, и цифры выглядят (неизменно) хорошими. Т.е. моя «проблема» «решена».

Однако я крайне озадачен тем, что вызвало эту проблему. Ни одно из действий, которые я предпринял для устранения проблемы, не возымело эффекта (поскольку после изменения всего этого потребовалось несколько часов, чтобы оно стало стабильным, а текущая настройка идентична той, которая была, когда все начало выходить из строя).

Я новичок, когда дело доходит до сетевого администрирования / проектирования, поэтому я не имею ни малейшего понятия относительно: - Что вообще привело к возникновению проблемы? - Как проблема решилась сама собой? - Как я должен был подойти к этой проблеме?

Я задаю эти вопросы здесь, потому что расстроен; Я не узнал ничего нового и не знаю, что делать в следующий раз, когда эта проблема появится. Возможно, мои вопросы слишком общие, но полезны любые полезные советы или ресурсы, описывающие похожие проблемы и решения!