Назад | Перейти на главную страницу

Какое регулярное обслуживание необходимо выполнять на вашем сервере Linux?

У меня есть сервер, на котором размещено несколько веб-сайтов, я не занимался обслуживанием около 2 месяцев, кроме просмотра нескольких журналов и их сжатия.

Вам просто интересно, какое регулярное обслуживание необходимо выполнять на вашем сервере Linux? Есть ли какие-нибудь сценарии, позволяющие выполнять обслуживание?

Самым важным является постоянное наблюдение за вашим сервером, чтобы вы знали, что происходит на сервере в любой момент. Важно отслеживать использование диска, использование ЦП, загрузку, использование памяти, трафик и т. Д. Существует множество инструментов с открытым исходным кодом, которые могут помочь вам с этой задачей. Это также поможет вам спланировать будущие обновления.

С другой стороны, вам необходимо выполнять регулярное и автоматическое резервное копирование, и очень важно время от времени тестировать свои резервные копии, чтобы убедиться, что они работают.

Также важно проверять наличие обновлений, особенно обновлений безопасности, и устанавливать их при необходимости.

Все, что можно сделать автоматическим способом, должно выполняться автоматически, но не забывайте время от времени проверять свои журналы.

Надеюсь это поможет!

Установите исправления для своей ОС, чтобы получить последние исправления ошибок и обновления безопасности. Это самый важный шаг, который вы можете сделать. Помимо этого, вам необходимо иметь мониторинг, чтобы сообщать вам о состоянии вашей системы с течением времени. Я не могу согласиться с вышеизложенным, что мониторинг - это не обслуживание. Вам необходимо получить базовое представление о вашей системе и о том, как она работает, чтобы в первую очередь увидеть, когда что-то не работает или требует обслуживания. Единственный способ действительно сделать это - построить график всего. Для этого мы используем комбинацию нагиос, кактусов и ганглиев.

Что касается скриптов, вы упомянули сжатие журналов, поэтому посмотрите на logrotate. Также есть журнал регистрации.

Здесь есть два полезных класса инструментов:

  1. Инструменты мониторинга лайк Nagios позволяют отслеживать использование и другую статистику.
  2. Инструменты управления конфигурацией лайк Кукольный и Повар позволяют делать заявления об ожидаемом состоянии системы (какие пакеты должны быть установлены, каким должно быть содержимое файлов и т. д.), а затем запускать их периодически, чтобы гарантировать соответствие системы.

Все предыдущие на этот вопрос - достойные ответы, но все они окрашены масштабным мышлением. Если у вас есть только один хост, предоставляющий веб-сайты, отказ которых не приведет к немедленной смерти котят, вы можете подумать немного меньше. Я бы посоветовал следующее:

Используйте logwatch или аналогичную систему, которая собирает ваши журналы и отправляет вам резюме. Читайте сводку хотя бы через день. Используйте инструмент, который превращает ваши блоги (например, аналоговые) в удобочитаемое резюме. Если вы хотите быть немного более амбициозным, используйте облачный сервис для мониторинга своих сайтов.

Однако суть обслуживания систем остается прежней: убейте каждую возникающую проблему, чтобы она могла никогда произойти снова. Это важный момент, потому что это означает, что не должно быть «регулярного» обслуживания.

Теперь о большем масштабе:

Одна из первых проблем, с которыми вы сталкиваетесь при расширении, - это то, что что-то ломается, а вы этого не знаете. Это никогда не должно повториться. Тогда вы получите полномасштабное решение для мониторинга. Кроме того, увидев, что проблема возникает на одном хосте, вы хотите предотвратить ее возникновение на любом другом хосте. Вот когда вы получаете систему управления конфигурацией.

Но здесь не следует расслабляться. Все ваши усилия должны быть направлены на постоянный решения.

Техническое обслуживание осуществляется путем мониторинга. Если у вас есть машина, подверженная внешнему доступу, у вас должны быть некоторые инструменты проверки: rkhunter, chkrootkit - это основы для ежедневной отправки почты .. smartd должен проверять жесткие диски и отправлять почту на случай, если что-то пойдет не так, tripwire для проверки целостности, помощник для IDS + проверка целостности и многие другие ... конечно предполагается, что система уже усилена (по крайней мере, с целевой политикой SElinux по умолчанию), было бы здорово проводить мониторинг производительности с помощью nagios, zabbix и других ... (чтобы продолжить присматриваюсь за неординарными событиями и состоянием машины)

Маркос сделал хорошее резюме общих моментов ОБСЛУЖИВАНИЯ: мониторинг, резервное копирование и обновления.

Я должен повторить (по комментариям людей), что мониторинг! = Обслуживание.

Хочу добавить: уборки старых пользователей, старых задач cron и т. д. Продление паролей. Эволюция конфигурации системы (с учетом истории мониторинга) (включая эволюцию мониторинга и резервного копирования) с изменениями срока службы сервера. Безопасность аудиты. Пользовательские отчеты (например, подробные сведения об использовании служб, общих ресурсов, отчеты о безопасности). И...

Восстановить резервные копии случайным образом (без необходимости делать это). Также всегда включайте копию MBR (Master Boot Record), если вы не используете систему автоматического развертывания для восстановления всего сервера.

Я видел, как брандмауэры выдерживают 500 дней безотказной работы (да, это ПЛОХОЕ ОБСЛУЖИВАНИЕ, потому что в год происходит около 10/15 обновлений ядра, поэтому большие времена безотказной работы, использовать, чтобы быть равным уязвимое ядро) без какого-либо вмешательства человека. Это просто хорошая конфигурация разделов, системного журнала и никаких серьезных изменений конфигурации.

Вы просите скрипты. Возможно, есть общие готовые сценарии, но это больше о Сделай сам (Сделай сам). Итак, сначала вы учиться или читать как работает ваша система (это включает в себя REAME, специфичные для дистрибутива, страницы руководства, политики и параметры компиляции), затем Эй подумай как ваша система должна себя вести, и затем ты записывать пользовательские скрипты (cron, пользовательские команды и т. д.) для управления комбинацией O.S. + желаемое поведение / результаты / отчеты / управление изменениями / откаты / реакции / и т. д.

Так же доступно общие инструменты (monit, nagios, cacti, zabbix и т. д.) могут быть расширенный с вашим сценарием навыки и умения и доступная третья сторона плагины.

Например: вам нужно только знать, «заполнен ли раздел», или вам также нужно контролировать температуру диска, свободные inodes, права на файлы и папки, контрольные суммы, S.M.A.R.T. статус, битые сектора, проверки файловой системы и предполагаемый жизненный цикл физического оборудования?

А также, как и резервные копии, система мониторинга + настройки должны быть проверены там, где это возможно, имитируя сбои, атаки и т. Д.

Настраиваемые сценарии лучше, если вы можете проверить их и устранить ошибки на предварительном сервере (ах), в среде, каталоге, базе данных и т. Д.