Я ищу решение с открытым исходным кодом для следующего:
У меня есть работа, которую нужно выполнять постоянно. Задания - это приложения или скрипты. Если они не работают, их нужно перезапустить. Если они терпят неудачу, скажем, 10 раз подряд или в течение определенного периода времени, скажем 1 часа, их необходимо отменить и направить уведомление в центральный репозиторий. Если задания начинают нагреваться (с использованием ЦП или памяти и т. Д.), Должны выдаваться предупреждения, а затем прекращаться, если они становятся слишком горячими. При желании задания могут быть запланированы на выполнение только в определенные часы.
Я знаю, что для этого должны быть открытые, платформенно-независимые, высокоуровневые (т.е. реализованные на Python и т. Д.), Комплексные, комплексные решения, но я даже не уверен, что искать и что это за система. называется. Я много гуглил, но еще не нашел ничего, что могло бы все это сделать.
Руководитель (написанный на Python) сделает большую часть того, что вы хотите, из коробки. Его можно расширить с помощью других функций, используя XML-RPC API.