<div dir="ltr"><div>I'm setting up slume on OpenHPC cluster with one master node and 5 compute nodes.</div><div>When I run test jobs, the jobs completely get stuck in the CG state.</div><div><br></div><div>Can someone help me hint on where I might have gone wrong?</div><div><br></div><div>[root@kla-ac-ohpc-01 critical]# srun -c 8 --pty bash -i</div>srun: error: slurm_receive_msgs: Socket timed out on send/recv operation<br>srun: error: Task launch for 37.0 failed on node c-node3: Socket timed out on send/recv operation<br>srun: error: Application launch failed: Socket timed out on send/recv operation<br><div>srun: Job step aborted: Waiting up to 32 seconds for job step to finish.</div><div><br></div><div>[root@kla-ac-ohpc-01 critical]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                36    normal     bash     test CG       0:53      2 c-node[1-2]<br>                37    normal     bash     root CG       0:52      1 c-node3</div><div><br></div><div>Thank you.</div><div><br></div><div>Regards,</div><div>Rodgers<br></div></div>