Мы рассматриваем возможность использования Sun Grid Engine на небольшом вычислительном кластере. Прямо сейчас текущая настройка довольно грубая и просто включает людей ssh на открытую машину для выполнения своих задач.
Мы хотели бы разрешить интерактивные задания, поскольку это должно упростить переход от ручного запуска заданий к их запуску с помощью qsub
. Но есть некоторые опасения, что, если мы это сделаем, люди могут случайно оставить свои интерактивные сеансы незанятыми и заблокировать выполнение других заданий на машинах. Проблема не только теоретическая, поскольку ранее мы пытались использовать OpenPBS, и возникла проблема с людьми, открывавшими интерактивное задание в сеансе экрана и, по сути, располагаясь лагерем на машине.
Есть ли способ настроить SGE для автоматического уничтожения бездействующих интерактивных заданий? Похоже, это было запрошено как улучшение (Номер выпуска: 2447) еще в 2007 году. Но, похоже, запрос никогда не был реализован.
у найрмила есть несколько хороших предложений. Другой вариант - ограничить количество компьютеров, на которых могут выполняться интерактивные задания. Мы в основном обозначаем некоторые узлы как «интерактивные» и ставим на них очередь, которая превышает объем ресурсов узла, поэтому многие пользователи могут войти в систему одновременно. Пользователи могут располагаться там столько, сколько захотят, но если они хотят получить доступ к некоторым реальным ресурсам, им необходимо отправить правильную работу.
Вы можете установить для SGE разумное время стены по умолчанию (h_rt) для завершения сеансов после предопределенного лимита.
Вы пытались настроить оболочку пользователя на тайм-аут при простое? Дополнительная информация и примеры на http://www.cyberciti.biz/faq/linux-unix-login-bash-shell-force-time-outs/.