Назад | Перейти на главную страницу

Узлы LSF умирают после исчерпания всей памяти

У меня есть кластер LSF, и у меня возникают следующие проблемы.

Через некоторое время случайные процессы ОС начинают умирать (они становятся зомби или перестают функционировать), и узлы LSF не сообщают о проблемах мастеру NSF. Я считаю, что это вызвано задачами LSF, исчерпывающими память (128 ГБ) на узлах.

Задачи запускаются от имени пользователя LSF без полномочий root.

Вопрос. Как заставить умирать задачи LSF вместо процессов ОС?

Мы будем благодарны за любые другие предложения и идеи.

(Настоящим признаю, что запоминать сложно.)