Назад | Перейти на главную страницу

Как определить причину высокой загрузки ресурсов в течение двух часов на прошлой неделе?

Я знаю, что есть несколько инструментов, которые я могу использовать, чтобы выяснить, что вызывает интенсивную загрузку сети и процессора. сейчас, но время от времени на своем сервере я проверяю журналы и замечаю, что были периоды очень высокой активности сети / процессора. Самое последнее событие произошло в определенный день на прошлой неделе.

Как я могу «оглянуться назад» и узнать, кто или что использует эти ресурсы, не «ловя их с поличным»?

Я использую Ubuntu 10.04.

При отсутствии полного журнала аудита (каждый запущенный процесс и потребляемые им ресурсы) вы действительно не можете этого сделать. Лучшее, что вы можете сделать, это просмотреть все запланированные задачи (cron рабочие места at вакансии) и все внешние воздействия, которые вы можете каталогизировать (запланированные задания в других системах, необычный запрос отчета от Большого Босса и т. д.), чтобы сделать обоснованное предположение.

Лучший способ узнать, что вызывает скачки нагрузки, - это мониторинг / оповещение в реальном времени: система, сообщающая вам: «Прямо сейчас у нас есть проблема», чтобы вы могли войти в систему и определить причину.

Ubuntu должен был установить для вас пакет "systat", пакет автоматически настраивает задание cron для сохранения всех системных показателей (CPU / MEM / DISK ...) в "/ usr / lib / sysstat", вам просто нужно прочитать исторические данные с sar -u | -d | -? -f имя файла

Существует ряд инструментов, которые могут отслеживать совокупную загрузку ЦП по процессам и / или записывать это значение с течением времени. Если вам нужны мелкие детали того, что происходит:

  • Настройте сетевой ответвитель на проводе, ведущем к серверу (либо аппаратный ответвитель, либо зеркальное отображение порта).
  • Прикрепите сниффер с файлами pcap round robin (для этого отлично подходит dumpcap).

Теперь у вас есть сетевой «черный ящик», который будет записывать все события за прошедшее X минут / часов (в зависимости от размера файла захвата).

  • Позвольте этой настройке работать, пока не произойдет событие.
  • Остановите процесс захвата и просмотрите захваченные пакеты.

Просмотр полного дампа пакета даст вам точную информацию о том, что происходит, и о том, какая конечная точка это запрашивает. Отлично подходит для устранения хронических проблем. Когда пользователь сообщает о случайных сбоях, а журнал ничего не показывает.

В дополнение к мониторингу ресурсов, который ищет периоды высокой загрузки ЦП для системы в целом, вы можете настроить мониторинг, который ищет длительные периоды высокой загрузки ЦП по процессам. У меня есть кое-что в этом роде, настроенное для моих ящиков Интернета и SQL, как для Linux, так и для Windows.

Иногда я вижу что-то всплески и использую 100% одного ядра. Этого было бы недостаточно, чтобы вызвать предупреждение о прямом процессоре в четырехъядерной системе, но этого достаточно, чтобы посмотреть на него.