Назад | Перейти на главную страницу

Единый мониторинг использования сервера Linux

Я использую целый набор инструментов для мониторинга нагрузки на сервер (Linux / Apache / MySQL / PHP) разных типов - top, iostat и netstat, а также свои собственные измерения в скрипте. Я собираю и обобщаю данные с помощью скриптов и электронных таблиц, чтобы получить общую картину того, чем занят мой сервер.

Есть ли простой инструмент / демон, который я могу установить под Linux, который будет тихо работать в фоновом режиме, собирать всю эту информацию через определенные промежутки времени, а затем предоставлять мне простые ежедневные / еженедельные / ежемесячные сводки для чтения?

Есть несколько инструментов, которые позволяют автоматически собирать показатели производительности для ваших серверов, например, Nagios, Кактусы и Мунин.

Большинство решений для мониторинга предоставляют веб-интерфейс, из которого вы можете легко визуализировать данные о производительности, соответствующие определенному периоду времени. Кроме того, поскольку они обычно хранят собранную информацию в базе данных, вы также можете воспользоваться этим, если вам нужно выполнить дальнейший анализ.

Кто-то упомянул сар (системный репортер), и я должен поддержать эту рекомендацию!

Похоже, вы проделали огромную работу самостоятельно с помощью различных инструментов. Однако вы могли обнаружить, что большая часть интересующих вас агрегированных системных данных была собрана садк (сборщик данных о деятельности системы) cron до тех пор, пока у вас есть sysstat пакет установлен в ваших системах. «Как ни странно, они не работают как демоны.

В садк скрипты (названные sa1 и sa2) собирают информацию с различных счетчиков ядра ... некоторые из них совпадают с запросами vmstat и другие взяты из тех же источников, что ifconfig используется для отчета об объеме данных, переданных и полученных на каждом интерфейсе, и так далее. По умолчанию sa1 работает каждые 10 минут.

В сар затем можно использовать команду для извлечения различных подмножеств этой информации из собранных данных. Чтобы ознакомиться со всеми доступными таблицами, запустите sar -A и перенаправить вывод в какой-нибудь удобный файл. Затем откройте файл в своем любимом редакторе в одном окне и откройте сар справочную страницу в другом. Теперь просто пройдитесь по всему файлу, ища на странице руководства различные идентификаторы заголовков столбцов.

Я также люблю использовать сар в качестве первого шага для устранения неполадок с необъяснимой производительностью и стабильностью. (Часто к тому времени, когда мне сообщают о таких проблемах, система уже была перезагружена или проблема носит временный характер). Эти данные часто являются наиболее доступными, поскольку пользователь (включая большинство младших и промежуточных системных администраторов, с которыми я работал) не знает, какие данные собирать перед перезагрузкой.

Уловка использования этих данных для посмертного устранения неполадок заключается в сканировании всех этих столбцов чисел в поисках пиков. (Да, если вы хорошо разбираетесь в таких инструментах, как GNUplot, вы можете сгенерировать из них кучу графиков; но, честно говоря, вы часто можете обнаружить всплески, просто просматривая необработанные числа). Посмотрите на несколько похожих систем, которые не обнаруживают проблем, или посмотрите данные в этой системе в те промежутки времени, когда кажется, что все в порядке. Как только вы заметите "всплески" (сетевой трафик, пейджинговая активность, дисковый ввод-вывод), попытайтесь сопоставить их (обычно я просто делаю копию данных и удаляю все "номинальные" данные, чтобы оставить мне только то, что, вероятно, доказательный). Первая корреляция, которую следует искать, заключается во времени различных всплесков ресурсов ... Неужели очередь выполнения внезапно выросла незадолго до того, как подкачка вышла из-под контроля? ... произошло ли огромное увеличение полученного сетевого трафика непосредственно перед тем, как количество дисковых операций ввода-вывода резко возросло? Затем вы соотносите это с выходом из последний (кто был авторизован в то время) ... и если вы включили учет процессов, вы можете посмотреть на Lastcomm команда. И, естественно, вы также можете посмотреть / var / log / * чтобы сосредоточиться на том же временном интервале (и, конечно, сканировать оттуда назад).

Вы будете удивлены, узнав, как много можно узнать из этого упражнения.

"Учетная запись Тома вошла в систему через несколько минут, потоки данных постепенно увеличивались через eth0 и на диск sdb3; возможно, он копировал набор данных, вероятно, из NetApps через Lan B ... затем мы видим огромный всплеск в распределении страниц памяти, но создание процесса оставалось номинальным до начала этого разбиения по страницам; именно тогда прерывания и очередь выполнения прошли через комнату и привели систему в режим OOM. Том, вы неуч! У вас есть утечка памяти в foobar.pl! " :)

Однако для своих целей вы можете использовать sar -A просто как отправная точка. Вы находите нужные вам биты, а затем звоните сар с различными аргументами для захвата каждой таблицы, которую вы хотите проанализировать, отфильтровать и построить график отдельно. Также есть варианты для рендеринга вывода в более удобном для машины формате.

sar это команда отчета о деятельности системы. Он может предоставлять данные в реальном времени (аналогично vmstat), а также сохранять данные в фоновом режиме для последующих отчетов.

В репозитории Debian есть несколько разных версий, посмотрите atsar и sysstat пакеты.

Вы также можете найти учет процессов. Когда любой процесс завершается, информация об использовании записывается в файл, из которого можно создавать отчеты. Посмотрите на acct пакет.

Вы можете использовать:

1.Морской лев.Это легкий инструмент. Поскольку вы предпочли SAR для использования, это было бы еще более привлекательно, так как мне казалось, что это расширение SAR; со всеми выходами на временной шкале (помогает отладить по времени), а также поддерживает все возможные команды оболочки, о которых можно подумать. Top, iostat, netstat, uptime и т. Д. - это команды по умолчанию, которые также позволяют добавлять свои собственные команды и настраивать интервал для сбора выходных данных. Однако он еще не выдает предупреждений.

2.Новая реликвия : Он возглавляет список инструментов мониторинга серверов и предоставляет отчеты в форме графиков, а также предоставляет предупреждения. Это немного тяжеловато и сложно настроить.

Это единственные два, которые я использовал и за которые могу поручиться.

Я недавно обнаружил Взгляды а от ssh довольно неплохо, больше чем top и htop. Это для одной машины.

Для мониторинга всех ваших серверов (виртуальных или физических) да NewRelic довольно хорошо, и недавно Монитис в качестве резервного варианта. Также Pingdom платный аккаунт - это полный набор утилит.

я использую Zabbix. Вы можете определить шаблоны для типа оборудования или видов использования. Вы можете отправлять отчеты, предупреждения с помощью различных средств связи, таких как почта, jabber или SMS (если у вас есть модем GSM или CDMA). Данные собираются с помощью SNMP или собственного zabbix-агента.

вы пытаетесь перейти по ссылке, у нее есть много вещей для мониторинга ..

http://www.cyberciti.biz/tips/top-linux-monitoring-tools.html