Назад | Перейти на главную страницу

Как настроить кластер K8s для использования резервной мощности ЦП для задач обучения машинного обучения (или другой низкоприоритетной работы с интенсивным использованием ЦП)

Я хотел бы использовать свободную мощность ЦП в нашем кластере Kubernetes для низкоприоритетных заданий - в частности, обучение машинного обучения с использованием Tensorflow в данном случае - без лишения высокоприоритетных сервисов в нашем кластере от ЦП, когда они внезапно резко возрастают, как можно было бы с приоритетом процесса ОС. В настоящее время мы настраиваем наш автомасштабирование для добавления дополнительных узлов, если загрузка ЦП превышает 60%, что означает, что до 40% нашего ЦП не используются постоянно.

Вопросы:

  1. Возможно ли такое с K8s? После некоторых экспериментов кажется, что Приоритет пакета это не совсем то же самое, поскольку мое развертывание с более низким приоритетом не сразу возвращает ЦП для развертывания с более высоким приоритетом.
  2. Если это невозможно, существует ли еще одна обычно используемая стратегия, позволяющая использовать преднамеренно избыточную мощность ЦП, но немедленно уступить место службам с более высоким приоритетом?