Назад | Перейти на главную страницу

Как быстро узнать, нормально ли работает * nix сервер?

Часто, когда я оказываюсь перед консолью unix / linux (или любого другого варианта * nix) и мне нужно быстро диагностировать состояние сервера, я просто не могу вспомнить все, что нужно проверить.

Я попробую vmstat, несколько маневров ps / top, прочитаю procinfo и некоторые файлы журналов (boot & sys), но что мне действительно нужно, так это быстрый способ просмотреть состояние ЦП, жесткого диска и физической памяти.

Кажется, я знаю, что многое из этого уже присутствует в vmstat, но почему-то мне не хватает простоты server 2008, где вы можете найти хороший монитор ресурсов, в то время как даже сам диспетчер задач может быстро просмотреть состояние системы (и даже не Говоря об инструментах графа мониторинга server 2008).

Есть предложения, или я просто хромаю, потому что vmstat действительно является Граалем?


Изменить: Хорошо, спасибо за отзывы, всем. Я должен добавить, что на самом деле я говорю не о постоянном мониторинге (где nagios - очень хорошее предложение), а о случайных прогулках к серверу - не обязательно к моему - для быстрого поиска состояния системы (иногда я просто где-нибудь и бац, эй, можешь зайти проверить это?)

Палка с некоторыми утилитными скриптами действительно хороша, уже есть одна с приложениями sysinternals для компьютеров Windows. Htop тоже классный, хотя я не думаю, что смогу установить его, где бы я ни находился.

если хотите наворотов под линукс - попробуйте htop.

это верх на стероидах, вы можете настроить его для отображения на «полосах» времени, проведенного процессором в пользовательском пространстве / system / iowait / irqs. это может дать вам хорошее представление о причине нагрузки.

тем не менее - некоторая информация, которую вы получаете от vmstat, не будет отображаться в htop.

вы также можете взглянуть на sar из sysstat. [iostat, упомянутый Кайлом Брандтом, является частью того же пакета].

В зависимости от того, сколько серверов у вас есть, вы можете настроить нагиос или аналогичная система мониторинга для этого. Обычно вы устанавливаете ограничения на показатели (использование ЦП, использование памяти и т. Д.), И если предел превышен, вы получаете предупреждение, которое может быть страницей, электронным письмом или чем-то еще. Однако, если это ваш домашний компьютер, я использую nmon. Он отлично подходит для получения полной картины вашей системы. Он будет отображать информацию об использовании памяти, диска, процессора и сети, а также информацию о ядре.

верхняя - хороший инструмент (если он установлен), но мне нравится еще один инструмент, который позволяет быстро посмотреть, что не так: dmesg. Это должно сообщить вам, если сервер испытывает что-то невероятно серьезное (отключение сетевых адаптеров, сбои диска, сбои памяти и т. Д.).

Не забывайте iostat, часть пакета sysstat. Если вам нужно что-то легко переносимое, почему бы не написать оболочку или Perl-скрипт, который можно было бы разработать с течением времени? Это был бы хороший способ изучить различия между системами и научиться лучше писать сценарии. Как правило, вы можете проанализировать большую часть информации вне процедуры или просто завершить все эти инструменты.

Обычно я запускаю top в качестве первой точки вызова, когда вхожу на хост, который сообщил о проблемах. Это дает вам хорошее представление о процессоре, памяти, длине очереди выполнения, а затем из этого я могу понять, что исследовать дальше. Если iowait запущен, я смотрю iostat, если памяти мало I ps, и смотрю, какие процессы используют память (или просто сортируют верхнюю часть по памяти) и т. Д.

Самое прекрасное в unix - это то, что вам не нужно принимать предлагаемые инструменты. Напишите сценарий, который покажет вам нужную информацию.

iostat vmstat top ps (помните, что вы можете настроить поля вывода ps - довольно q потеряно с gnu ps) df dmesg / var / log / messages sar Вы можете использовать syslogNG для фильтрации всех критических сообщений журнала в отдельный файл журнала.

Одна необычная вещь, которую стоит проверить в Linux, - это / proc / mounts. Иногда файловая система доступна только для чтения, но это не отображается при монтировании, а отображается в / proc / mounts. Я видел это как на виртуальных машинах, так и с хранилищем FC (например, где путь странным образом исчез).

Еще одна программа «топ на стероидах»: наверху. Так многословно, это страшно.