Назад | Перейти на главную страницу

Есть ли способ проверить использование ресурсов в кластере с SLURM?

Не уверен, что этот вопрос лучше подходит здесь или в Unix.SE, но я решил, что здесь он более уместен. Я провожу трудоемкое исследование национального кластера, который использует SLURM для планирования заданий.

Я понял, что часть моего пакетного сценария (который создает группу дочерних процессов) работает намного медленнее, чем я ожидал, и я подозреваю, что используемым мною инструментом анализа вызывается слишком много потоков.

Я надеялся проверить, не слишком ли много переключателей контекста, но похоже, что я нужен PID для проверки количества переключателей контекста. Проверка процессов ps или top не дал никаких совпадений для имени конкретного инструмента, который я использую, поэтому я полагаю, что фактические процессы, которые запускаются моим скриптом, «скрыты» SLURM на другом уровне. Я полагаю, это имеет смысл, поскольку реальный компьютер, с которым я взаимодействую через ssh, и узел, выполняющий вычисления, не совпадают.

Но есть ли способ, с помощью которого я могу проверить такие вещи, как использование процессора (например,% load) или количество переключателей контекста, из командной строки?