Назад | Перейти на главную страницу

Время загрузки страницы vs tcptraceroute

Я менеджер проекта, работающий со сложным веб-приложением, которое размещено на 3 разных кластерах (серверах) в разных частях мира. В каждом кластере код одинаковый.

Но время загрузки страницы Google отличается от кластера к кластеру, и отклонение очень велико - оно варьируется от 2,5 секунд в кластере A (что нормально) до 6 секунд в кластере B (что намного превышает SLA компании).

Мы реализовали HTTP-проверки NAGIOS, чтобы увидеть, что он покажет, и цифры во многом похожи на время загрузки страницы Google.

Наши администраторы устраняют эту проблему с помощью обычных tcptraceroutes и показывают числа от 0,5 до 1,8 секунды, после какого вердикта это нет проблем с сетью или серверами.

Вопрос такой:

1) Уместна ли проверка tcptraceroute для устранения проблем такого рода?

2) Есть ли другой способ устранить время загрузки страницы со стороны администратора?

3) Мой главный аргумент для администраторов, чтобы они продолжали исследовать эту проблему, заключается в том, что время загрузки страницы в одном кластере составляет 2,5 секунды, а в другом - 6 секунд. (Как в проверках GA, так и в NAGIOS) Разве этого недостаточно администраторам, чтобы продолжить расследование?

Спасибо и извините, если я затронул чувства smbdy такими неопределенными вопросами.

Подходит ли tcptraceroute check для устранения проблем такого рода?

Это может быть полезно для проверки сетевого пути между вашей точкой мониторинга и удаленным сервером.

Есть ли другой способ устранить проблемы со временем загрузки страницы со стороны администратора?

Научный метод твой друг, я писал об этом Вот.

Я бы начал это расследование, сначала подтвердив, что оба кластера абсолютно одинаковы. Если это не так, я бы попытался понять, чем они отличаются, каковы последствия этих различий и повлияют ли они на приложение наблюдаемым образом.

Я бы проверил журналы, чтобы узнать, регистрирует ли приложение / кластер / ОС что-нибудь интересное.

Я бы настроил мониторинг ресурсов на серверах кластера и посмотрел, есть ли что-нибудь нежелательное и т. Д.

Общее базовое системное администрирование и действительно диагностика.

Я бы тоже вовлек в это разработчиков. Возможно, им необходимо настроить приложение, чтобы оно могло предоставлять более качественную диагностическую и журнальную информацию. Например, если приложение обращается к базе данных, возможно, им нужно иметь возможность регистрировать время выполнения запроса.