<div dir="ltr"><div dir="ltr">Hi Matteo,<div><br></div><div>Hard to say without seeing your priority config values, but I'm guessing you want to take a look at <a href="https://slurm.schedmd.com/priority_multifactor.html">https://slurm.schedmd.com/priority_multifactor.html</a>.</div><div><br></div><div>Regards,</div><div>Lyn</div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Apr 14, 2020 at 12:02 AM Matteo F <<a href="mailto:mfasco984@gmail.com">mfasco984@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex"><div dir="ltr">Hello there, <br>I am having problems understanding the slurm scheduler, with regard to the "nice" parameter.<br><br>I have two types of job: one is low priority and uses 4 CPUs (--nice=20), the other one is high priority and uses 24 CPUs (--nice=10).<br>When I submit, let's say, 50 low-priority jobs, only 6 are executed - this is fine since a job uses 4 CPUs and the node has 24.<br>However, when I submit my high priority job that must use 24 CPUs, things get strange.<br><br>What I was expecting: <br>- slurm would have stopped starting low-priority queued jobs (switching from PD -> R)<br>- waited to have 24 CPUs free (in this case, to have no running jobs)<br>- run the high priority job<br>- when the job has completed, start the low priority jobs as usual<br><br>What I instead observed:<br>- slurm keep starting queue job like I didn't specified a nice parameter.<br><br><br>(partial) slurm config:<br>SwitchType=switch/none<br>TaskPlugin=task/none<br>FastSchedule=1<br>SchedulerType=sched/backfill<br>SelectType=select/cons_res<br>SelectTypeParameters=CR_Core_Memory<br>NodeName=node01 CPUs=24 RealMemory=120000 Sockets=2 CoresPerSocket=6 ThreadsPerCore=2   State=UNKNOWN<br><br>Low priority job:<br>#SBATCH --job-name=task4<br>#SBATCH --ntasks=4<br>#SBATCH --mem=1gb<br>#SBATCH --time=10:00:00<br>#SBATCH --output=%j.out<br>#SBATCH --error=%j.err<br>#SBATCH --partition=ogre<br>#SBATCH --account=ogre<br>#SBATCH --nice=20<br><br>High priority job:<br>#SBATCH --job-name=task24<br>#SBATCH --ntasks=24<br>#SBATCH --mem=1gb<br>#SBATCH --time=10:00:00<br>#SBATCH --output=%j.out<br>#SBATCH --error=%j.err<br>#SBATCH --partition=ogre<br>#SBATCH --account=ogre<br>#SBATCH --nice=10<br><br>Do you have any idea of what I am missing?<br><br>Thanks a lot.<br>Matteo<br></div>
</blockquote></div>