<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Wingdings;
        panose-1:5 0 0 0 0 0 0 0 0 0;}
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal">I’ve hit an issue with binding using slurm 21.08.5 that I’m hoping someone might be able to help with.  I took a scan through the e-mail list but didn’t see this one - apologies if I missed it.  Maybe I just need a better understanding
 on why this is happening but feels like a bug.  <o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">The issue is that if I include the hint=nomultithread to an salloc (or sbatch) it seems to break the binding for the srun within it.  Works find if it is a direct srun.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Here are the examples of running the sruns directly and things look good:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">~> srun -n 4 -N 1 --ntasks-per-node=4 --cpu_bind=v,map_cpu:0,16,32,48 /bin/true<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MAP  - cn4, task  0  0 [103837]: mask 0x1 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MAP  - cn4, task  1  1 [103838]: mask 0x10000 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MAP  - cn4, task  2  2 [103839]: mask 0x100000000 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MAP  - cn4, task  3  3 [103840]: mask 0x1000000000000 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><o:p> </o:p></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">~> srun --hint=nomultithread -n 4 -N 1 --ntasks-per-node=4 --cpu_bind=v,map_cpu:0,16,32,48 /bin/true<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MAP  - cn4, task  0  0 [103992]: mask 0x1 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MAP  - cn4, task  1  1 [103993]: mask 0x10000 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MAP  - cn4, task  2  2 [103994]: mask 0x100000000 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MAP  - cn4, task  3  3 [103995]: mask 0x1000000000000 set<o:p></o:p></span></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">And here are the sruns wrapped by an salloc:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">~> salloc --exclusive -N 1 -n 4 srun -n 4 -N 1 --ntasks-per-node=4 --cpu_bind=v,map_cpu:0,16,32,48 /bin/true<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Granted job allocation 282077<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Waiting for resource configuration<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Nodes cn4 are ready for job<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MAP  - cn4, task  0  0 [169441]: mask 0x1 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MAP  - cn4, task  1  1 [169442]: mask 0x10000 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MAP  - cn4, task  2  2 [169443]: mask 0x100000000 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MAP  - cn4, task  3  3 [169444]: mask 0x1000000000000 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Relinquishing job allocation 282077<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><o:p> </o:p></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">~> salloc --hint=nomultithread --exclusive -N 1 -n 4 srun -n 4 -N 1 --ntasks-per-node=4 --cpu_bind=v,map_cpu:0,16,32,48 /bin/true<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Granted job allocation 282078<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Waiting for resource configuration<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Nodes cn4 are ready for job<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MASK - cn4, task  0  0 [169586]: mask 0xf0000000000000000000000000000000f set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MASK - cn4, task  1  1 [169587]: mask 0xf0000000000000000000000000000000f set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MASK - cn4, task  2  2 [169588]: mask 0xf0000000000000000000000000000000f set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MASK - cn4, task  3  3 [169589]: mask 0xf0000000000000000000000000000000f set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Relinquishing job allocation 282078<o:p></o:p></span></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I do see that the binding has changed to cpu-bind=MASK.  Maybe that is a clue. 
<span style="font-family:Wingdings">J</span>  Even if I send in a mask, mine is not fully used in the presence of the hint:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">~> salloc --exclusive -N 1 -n 4 srun -n 4 -N 1 --ntasks-per-node=4 --cpu_bind=v,mask_cpu:0x1,0x1000,0x100000000,0x1000000000000 /bin/true<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Granted job allocation 282084<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Waiting for resource configuration<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Nodes cn4 are ready for job<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MASK - cn4, task  0  0 [125303]: mask 0x1 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MASK - cn4, task  1  1 [125304]: mask 0x1000 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MASK - cn4, task  2  2 [125305]: mask 0x100000000 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MASK - cn4, task  3  3 [125306]: mask 0x1000000000000 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Relinquishing job allocation 282084<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><o:p> </o:p></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">~> salloc --hint=nomultithread --exclusive -N 1 -n 4 srun -n 4 -N 1 --ntasks-per-node=4 --cpu_bind=v,mask_cpu:0x1,0x1000,0x100000000,0x1000000000000 /bin/true<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Granted job allocation 282085<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Waiting for resource configuration<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Nodes cn4 are ready for job<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MASK - cn4, task  0  0 [125462]: mask 0x1 set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MASK - cn4, task  1  1 [125463]: mask 0xf0000000000000000000000000000000f set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MASK - cn4, task  2  2 [125464]: mask 0xf0000000000000000000000000000000f set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">cpu-bind=MASK - cn4, task  3  3 [125465]: mask 0xf0000000000000000000000000000000f set<o:p></o:p></span></p>
<p class="MsoNormal" style="margin-left:.5in"><span style="font-size:10.0pt;font-family:"Courier New"">salloc: Relinquishing job allocation 282085<o:p></o:p></span></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Note that the mask is ignored for tasks 1, 2, and 3 in this latter case.  Pretty sure my syntax is correct as it worked in the first test without the hint.   I also have 22.05.0 installed but not active.  I’ll try it with that later today
 and report the results.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Brent<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</body>
</html>