<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;
        mso-fareast-language:EN-US;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-GB" link="#0563C1" vlink="#954F72" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal">Hi<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I am just building my first Slurm setup and have got everything running – well, almost.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I have a two node configuration. All of my setup exists on a single HyperV server and I have divided up the resources to create my VMs<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">One node I will use for heavy duty work; this is called compute001<o:p></o:p></p>
<p class="MsoNormal">One node I will use for normal work; this is called compute002<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">My compute node specification in slurm.conf is<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">NodeName=DEFAULT CPUs=1 RealMemory=1000 State=UNKNOWN<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">NodeName=compute001 CPUs=32<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">NodeName=compute002 CPUs=2<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">The partition specification is<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">PartitionName=DEFAULT State=UP<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">PartitionName=interactive Nodes=compute002 MaxTime=INFINITE OverSubscribe=FORCE<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">PartitionName=simulation Nodes=compute001 MaxTime=30 OverSubscribe=FORCE<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I have added the OverSubscribe=FORCE option as I want more than one job to be able to land on my interactive/simulation queues.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">All of the nodes and cluster master start up fine and they all talk to each other but no matter what I do, I cannot get my cluster to accept more than one job per node.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Can you help me determine where I am going wrong?<o:p></o:p></p>
<p class="MsoNormal">Thanks a lot<o:p></o:p></p>
<p class="MsoNormal">Jake<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">The entire slurm.conf is pasted below<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt"># slurm.conf file generated by configurator.html.<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">ClusterName=pm-slurm<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmctldHost=slurm-master<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">MpiDefault=none<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">ProctrackType=proctrack/cgroup<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">ReturnToService=2<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmctldPidFile=/var/run/slurmctld.pid<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmctldPort=6817<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmdPidFile=/var/run/slurmd.pid<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmdPort=6818<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmdSpoolDir=/var/spool/slurmd<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmUser=slurm<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">StateSaveLocation=/home/slurm/var/spool/slurmctld<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SwitchType=switch/none<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">TaskPlugin=task/cgroup<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">#<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt"># TIMERS<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">InactiveLimit=0<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">KillWait=30<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">MinJobAge=300<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmctldTimeout=120<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmdTimeout=300<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">Waittime=0<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">#<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt"># SCHEDULING<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SchedulerType=sched/backfill<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SelectType=select/cons_tres<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SelectTypeParameters=CR_Core_Memory<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">#<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt"># LOGGING AND ACCOUNTING<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">JobAcctGatherFrequency=30<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">JobAcctGatherType=jobacct_gather/cgroup<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmctldDebug=info<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmctldLogFile=/var/log/slurmctld.log<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmdDebug=info<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">SlurmdLogFile=/var/log/slurmd.log<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt"><o:p> </o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt"># COMPUTE NODES<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">NodeName=DEFAULT CPUs=1 RealMemory=1000 State=UNKNOWN<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">NodeName=compute001 CPUs=32<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">NodeName=compute002 CPUs=2<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt"><o:p> </o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">PartitionName=DEFAULT State=UP<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">PartitionName=interactive Nodes=compute002 MaxTime=INFINITE OverSubscribe=FORCE<o:p></o:p></p>
<p class="MsoNormal" style="margin-left:36.0pt">PartitionName=simulation Nodes=compute001 MaxTime=30 OverSubscribe=FORCE<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>