<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css" style="display:none;"><!-- P {margin-top:0;margin-bottom:0;} --></style>
</head>
<body dir="ltr">
<div id="divtagdefaultwrapper" style="font-size:12pt;color:#000000;font-family:Calibri,Helvetica,sans-serif;" dir="ltr">
<p style="margin-top:0;margin-bottom:0"></p>
<div>Hello,</div>
<div><br>
</div>
<div>A colleague intimated that he thought that larger jobs were tending to get starved out on our slurm cluster. It's not a busy time at the moment so it's difficult to test this properly. Back in November it was not completely unusual for a larger job to
 have to wait up to a week to start. </div>
<div><br>
</div>
<div>I've extracted the key scheduling configuration out of the slurm.conf and I would appreciate your comments, please. Even at the busiest of times we notice many single compute jobs executing on the cluster -- starting either via the scheduler or by backfill.</div>
<div><br>
</div>
<div>Looking at the scheduling configuration do you think that I'm favouring small jobs too much? That is, for example, should I increase the PriorityWeightJobSize to encourage larger jobs to run? </div>
<div><br>
</div>
<div>I was very keen not to starve out small/medium jobs, however perhaps there is too much emphasis on small/medium jobs in our setup. </div>
<div><br>
</div>
<div>My colleague is from a Moab background, and in that respect he was surprised not to see nodes being reserved for jobs, but it could be that Slurm works in a different way to try to make efficient use of the cluster by backfilling more aggressively than
 Moab. Certainly we see a great deal of activity from backfill. </div>
<div><br>
</div>
<div>In this respect does anyone understand the mechanism used to reserve nodes/resources for jobs in slurm or potentially where to look for that type of information.</div>
<div><br>
</div>
<div></div>
<div>Best regards,</div>
<div>David</div>
<div><br>
</div>
<div>SchedulerType=sched/backfill</div>
<div>SchedulerParameters=bf_window=3600,bf_resolution=180,bf_max_job_user=4</div>
<div><br>
</div>
<div>SelectType=select/cons_res</div>
<div>SelectTypeParameters=CR_Core</div>
<div>FastSchedule=1</div>
<div>PriorityFavorSmall=NO</div>
<div>PriorityFlags=DEPTH_OBLIVIOUS,SMALL_RELATIVE_TO_TIME,FAIR_TREE</div>
<div>PriorityType=priority/multifactor</div>
<div>PriorityDecayHalfLife=14-0</div>
<div><br>
</div>
<div>PriorityWeightFairshare=1000000</div>
<div>PriorityWeightAge=100000</div>
<div>PriorityWeightPartition=0</div>
<div>PriorityWeightJobSize=100000</div>
<div>PriorityWeightQOS=10000</div>
<div>PriorityMaxAge=7-0</div>
<br>
<p></p>
</div>
</body>
</html>