Ist es möglich, über qsub übermittelte Jobs anzuhalten?


10

Ich führe meine Jobs in einem kleinen Cluster aus. Ich habe sie über eingereicht qsub. Jetzt brauchen meine Labkameraden dringend Ressourcen als ich, also muss ich entweder meine Jobs töten oder sie pausieren, wenn möglich.

Gibt es eine Möglichkeit, meine Jobs anzuhalten und die CPU, den RAM usw. freizugeben?

Ich bin ein normaler Benutzer (keine Root-Rechte).


1
Sie können Ihre noch nicht ausgeführten Jobs mit zurückhalten qhold, dies wirkt sich jedoch nicht auf bereits ausgeführte Jobs aus. Es scheint, dass qmodlaufende Jobs angehalten werden können, aber Root- oder Manager-Berechtigungen erforderlich sind.
Jofel

Angenommen, Sie haben einen MOAB-Cluster: Sie können Ihren Job anhalten
Ott Toomet

Antworten:


6

Wenn die Jobs noch nicht gestartet wurden, können Sie sie mit auf Eis legen qhold. Verwenden Sie qrlszum Neustart.

qhold <job ID>
qrls <job ID>

Wenn sie bereits ausgeführt werden, können Sie sie qsigzum Anhalten und Fortsetzen von Jobs verwenden (möglicherweise benötigen Sie zusätzliche Berechtigungen, fragen Sie Ihren Administrator, ob dies der Fall ist):

qsig -s suspend <job ID>
qsig -s resume <job ID>

Sobald Sie Ihren Job wieder aufgenommen haben, müssen Sie ihn möglicherweise zum Ausführen zwingen qrun

qrun <job ID>

Getestet auf einem SLES 11 SP4-System mit PBSPro 13.0.2.153173, aber ich bin zuversichtlich, dass es mit anderen POSIX-kompatiblen Batch-Jobübermittlungssystemen funktionieren sollte.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.