Интересно, как вы проверяете, правильно ли работает сервер после некоторых изменений конфигурации или установки патча? Например, мне было довольно сложно проверить, не повлияли ли внесенные вами изменения на все приложения, работающие на сервере.
Знаете ли вы какой-нибудь «автоматический» способ проверки таких вещей?
Для этого используется системный мониторинг. У вас есть система мониторинга, проверяющая все сайты и службы, работающие на сервере, а затем, если вы что-нибудь сломаете (или сломается само по себе), вы об этом узнаете.
Что ж, вам действительно нужно сделать перед всем этим, так это определить, как вы оцениваете правильную работу. Вам нужно посмотреть на свой сервер и на то, что он делает, и сказать: хорошо, чтобы этот сервер работал правильно, он должен успешно выполнять X Y и Z.
Возможно, он должен правильно обслуживать веб-страницы, получать электронные письма и разрешать доступ по FTP для веб-сервера. Если это так, то да, вы можете автоматизировать это, у вас могут быть некоторые службы мониторинга или сценарии, которые проверяют эти службы или получают доступ к этим веб-страницам и т. Д.
То, что вы ищете, называется программное обеспечение для мониторинга. См. Например материал под https://serverfault.com/questions/tagged/monitoring чтобы получить представление.
Большинство программ мониторинга будут выполнять простые проверки сразу после установки (порт открыт / загружается веб-сайт / служба, такая как FTP / SMTP / и т. Д., Отвечает). Если вам нужны более исчерпывающие проверки (убедитесь, что определенная веб-страница содержит определенный текст и т. Д.), Вам придется написать их самостоятельно (поскольку это зависит от приложения), но программное обеспечение вам поможет.
Я лично могу порекомендовать ZenOSS, но их много.
На самом деле зависит от службы сервера.
В большинстве случаев вы можете сделать следующее (не сразу);
Вы не можете полностью протестировать ее или полностью узнать, работает ли система, потому что исправления ошибок могут создавать крайние случаи, когда она не работает должным образом при определенных обстоятельствах.
Вы имеете в виду, что хотите проверить, что службы сохраняются на серверах после обновлений? В этом случае программы вроде Nagios должны быть идеальными. Вы имеете в виду проверить правильность работы серверов? Насколько мне известно, это означает либо написание собственных тестовых примеров, либо ручное тестирование, поскольку, например, ваш веб-сервер может появиться, но он выдает сообщения об ошибках, потому что ваша служба базы данных, на которую веб-сервер полагается для вашего приложения, мертва.
РЕДАКТИРОВАТЬ: Хорошо, NAGIOS может контролировать на уровне обслуживания; Я имею в виду, что службы могут быть «там», но на что-то влияет так, что они выдают ошибки, поэтому полагаясь на автоматизацию, вы получите ложное чувство безопасности. У нас были случаи, когда наша телефонная система Cisco (Callmanager), казалось, работала нормально, но через некоторое время обнаруживала, что определенные голосовые сообщения неправильно маршрутизируются на почтовый сервер; мы не знали этого до тех пор, пока не исследовали пользователей, заявивших, что им сказали, что у них есть голосовая почта, которую они никогда не получали ... автоматический мониторинг служб не обнаружил бы этого без специальной проверки журналов, поскольку все в Callmanager говорило, что это работоспособно).
Если у вас есть конкретная потребность или конкретный случай, вы можете немного сузить его и посмотреть, какие результаты вы получите здесь. Я вижу аналогичную параллель в аппаратном обеспечении; как я могу убедиться, что моя обновленная память работает на моем компьютере? «Загрузите его и используйте». Это не значит, что вы не увидите странных сбоев, потому что память не вполне правильно установлен или имеет крошечный производственный дефект, который проявляется при определенном диапазоне температур.
Это еще одна причина рассмотреть возможность виртуализации. Вы можете свести к минимуму влияние обновлений, упростить восстановление после проблем и упростить разделение служб на отдельные серверы (веб-сервер обрабатывает веб-задачи и т. Д.), А также отслеживать использование диска и сети, чтобы получить представление о работоспособности ваши серверы немного проще. Просто выбрасываю это как что-то, что нужно учитывать, если появится возможность :-)