<html><head><meta http-equiv="content-type" content="text/html; charset=GB2312"><style>body { line-height: 1.5; }body { font-size: 10.5pt; font-family: ËÎÌå; color: rgb(0, 0, 0); line-height: 1.5; }</style></head><body>
<div><span></span><div><div>Hi,</div><div>I have installed SLURM 18.08.0-0pre2 on a my cluster based on RHEL7.4 (x86_64).</div><div>My configure parameters likes this: </div><div>./configure --prefix=/opt/slurm17 --with-munge=/opt/munge --with-pmix=/opt/pmix --with-ucx=/opt/openucx --with-hwloc=/usr </div><div>(openucx version is 1.5.0, pmix version is 3.0.0, hwloc version is 1.11.8)</div><div><br></div><div>After completing the installation and configuration, it looks like slurm is working normally. But when I submitted a simple test job with sbatch sleep.sh£¨just call srun sleep 30 at single computing node£©, I found that the job (ID=1032) state was R, but <span style="font-size: 10.5pt; line-height: 1.5; background-color: transparent;">the job did not start normally on the computation node (no process found).</span></div></div><div><br></div><div><div>The appendix is the output log of the computing node of the management node.</div><div>I can't tell if the cause of this problem is related to the compilation parameters I specify (such as pmix, ucx), and I've never seen anything similar in earlier versions.</div><div>Has anyone ever responded to a similar phenomenon with me? How to solve the problem? </div><div><br></div></div><div>Best regards</div></div>
<div><br></div><hr style="width: 210px; height: 1px;" color="#b5c4df" size="1" align="left">
<div><span><div style="MARGIN: 10px; FONT-FAMILY: verdana; FONT-SIZE: 10pt"><div>zhangtao102019@126.com</div></div></span></div>
</body></html>