Я использую Solaris SMF для мониторинга, создания отчетов и автоматического перезапуска процессов после сбоя в системах Solaris. Есть ли что-нибудь подобное в виде портативного открытого исходного кода или в ядре Linux? Для тех, кто не знаком с SMF, меня интересуют следующие функции:
Система запускает сценарий для запуска службы, а затем отслеживает все созданные ею процессы, даже если они создают свою собственную группу процессов. Если все они умирают, он запускает сценарий остановки, а затем снова сценарий запуска.
Автоматически выполнять цикл остановки / запуска по команде, ожидая остановки всех процессов, прежде чем инициировать запуск.
Дерево зависимостей службы с правилами обработки сбоев. Например, служба «A» должна быть запущена до того, как может запуститься служба «B». Если "A" выходит из строя, "B" должен быть остановлен.
Получите список служб, которые в настоящее время не работают из-за сбоя их сценария запуска.