<div dir="ltr"><br>I'm doing my first slurm installation.  The schedmd docs assume that I have a cluster that meets certain (unstated) requirements available, but I don't.  I've found a couple of examples showing how to setup a cluster for slurm using real hardware (nodes) with GPUs:<br><br>  <a href="https://github.com/mknoxnv/ubuntu-slurm">https://github.com/mknoxnv/ubuntu-slurm</a><br>  <a href="https://github.com/nateGeorge/slurm_gpu_ubuntu">https://github.com/nateGeorge/slurm_gpu_ubuntu</a><br><br>The requirements for a cluster for slurm seem to be:<br><br>  Passwordless SSH is working between slurm controller and slurm nodes<br>  There is shared storage between all the nodes: /storage & /home (NFS)<br>  The UIDs and GIDs will be consistent between all the nodes. (LDAP or other)<br>  Hostnames have to be a FQDN.<br>  Slurm will be used to control SSH access to compute nodes.<br>  Compute nodes are DNS resolvable.<br>  Compute nodes have GPUs and the latest CUDA drivers installed<br>  Time has to be synchronized across all nodes and controller (ntp or freeipa)<br>  (If time isn't synch'ed properly the controller might not start)<br><br><br>My questions are:<br><br>  Are the cluster requirements above correct and complete?<br><br>  Can I use virtual machines without GPUs for my nodes?<br>  (This is just to get started.  Eventually I'll have real hardware with GPUs for my nodes.)<br><br>  From the Ubuntu link on your download page I've downloaded these files:<br><br>    slurmctld_18.08.6.2-1_amd64.deb      610.9 kB<br>    slurm-client_18.08.6.2-1_amd64.deb   887.7 kB<br>    slurm-wlm_18.08.6.2-1_amd64.deb      12.3 kB<br><br>  The slurmctld would be installed on my controller, but what do I install on my nodes?<br>  The slurm-wlm file is very small.  Would I install it on my node?  What is the client for?<br><br><div>Thank you.</div><div><br></div></div>