<div dir="ltr"><div dir="ltr"><div>Hi,</div><div><br></div><div>We also have hybrid cluster(s).</div><div>We use the same nfsroot for all nodes, so technically everything is installed everywhere. And we compile slurm once with everything needed.</div><div><br></div><div>Users can run "module load cuda" and/or "module load nvidia" to have access to nvcc and nvidia's libraries (cuda and nvidia are manually installed here as well), so they can compile gpu code, but it won't run on nodes with no nvidia hardware.<br></div><div><br></div><div>The infiniband is that same, though we don't have hybrid clusters. I.e. one cluster has IB, and one doesn't. But they all run the same binaries.</div><div><br></div><div>HTH,</div><div>    Yair.</div><div><br></div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sat, Feb 29, 2020 at 5:24 PM <<a href="mailto:dean.w.schulze@gmail.com">dean.w.schulze@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">There are GPU plugins that won't be built unless you build on a node that has the Nvidia drivers installed.<br>
<br>
-----Original Message-----<br>
From: slurm-users <<a href="mailto:slurm-users-bounces@lists.schedmd.com" target="_blank">slurm-users-bounces@lists.schedmd.com</a>> On Behalf Of Brian Andrus<br>
Sent: Friday, February 28, 2020 7:36 PM<br>
To: <a href="mailto:slurm-users@lists.schedmd.com" target="_blank">slurm-users@lists.schedmd.com</a><br>
Subject: [slurm-users] Hybrid compiling options<br>
<br>
All,<br>
<br>
Wanted to reach out for input on how folks compile slurm when you have a hybrid cluster.<br>
<br>
Scenario:<br>
<br>
you have 4 node types:<br>
<br>
A) CPU only<br>
B) GPU Only<br>
C) CPU+IB<br>
D) GPU+IB<br>
<br>
So, you can compile slurm with/without IB support and/or with/without GPU support.<br>
Including either option creates a dependency when packaging (RPM based).<br>
<br>
So, do you compile different versions for the different node types or install the dependent packages on nodes that have no user (nvidia in particular here)?<br>
<br>
Generally, I have always added the superfluous packages, but wondered what the thoughts on that are.<br>
<br>
Brian Andrus<br>
<br>
<br>
<br>
<br>
</blockquote></div><br></div>