<html><head><meta http-equiv="content-type" content="text/html; charset=UTF-8"><style>body { line-height: 1.5; }blockquote { margin-top: 0px; margin-bottom: 0px; margin-left: 0.5em; }div.FoxDiv20180823171831530389 { }body { font-size: 10.5pt; font-family: 宋体; color: rgb(0, 0, 0); line-height: 1.5; }</style></head><body>
<div><span></span>Hi <span style="font-family: tahoma; font-size: 12px; line-height: 18px; background-color: rgb(239, 239, 239);"> </span><a href="mailto:artpol84@gmail.com" style="font-family: tahoma; font-size: 12px; line-height: 18px; background-color: rgb(239, 239, 239);">Artem Polyakov</a>,</div><div>I submitted the same job for testing in the latest 18.08.0rc1 release and found no similar problems in 18.08.0pre2.</div><div>The pre2 version mentioned earlier does not need further analysis. </div><div><span style="font-size: 10.5pt; line-height: 1.5; background-color: transparent;">Thank you for your help.</span></div><div><span style="font-size: 10.5pt; line-height: 1.5; background-color: transparent;">Best regards  </span></div>
<div><br></div><hr style="width: 210px; height: 1px;" color="#b5c4df" size="1" align="left">
<div><span><div style="MARGIN: 10px; FONT-FAMILY: verdana; FONT-SIZE: 10pt"><div>zhangtao102019@126.com</div></div></span></div>
<blockquote style="margin-Top: 0px; margin-Bottom: 0px; margin-Left: 0.5em"><div> </div><div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm"><div style="PADDING-RIGHT: 8px; PADDING-LEFT: 8px; FONT-SIZE: 12px;FONT-FAMILY:tahoma;COLOR:#000000; BACKGROUND: #efefef; PADDING-BOTTOM: 8px; PADDING-TOP: 8px"><div><b>From:</b> <a href="mailto:zhangtao102019@126.com">zhangtao102019@126.com</a></div><div><b>Date:</b> 2018-08-23 10:14</div><div><b>To:</b> <a href="mailto:slurm-users@lists.schedmd.com">Slurm User Community List</a></div><div><b>CC:</b> <a href="mailto:slurm-users@schedmd.com">slurm-users</a></div><div><b>Subject:</b> Re: Re: [slurm-users] Job cannot start on slurm v18.08.0pre2</div></div></div><div><div class="FoxDiv20180823171831530389">
<div><span></span><div>Hi, </div><div>My test script is like this:</div><div>=========================</div><div>#!/bin/bash</div><div>#SBATCH -J LOOP</div><div>#SBATCH -p low</div><div>#SBATCH --comment test</div><div>#SBATCH -N 1</div><div>#SBATCH -n 5</div><div>#SBATCH -o log/%j.loop</div><div>#SBATCH -e log/%j.loop</div><div><br></div><div>date</div><div>echo "SLURM_JOB_NODELIST=${SLURM_JOB_NODELIST}"</div><div>echo "SLURM_NODELIST=${SLURM_NODELIST}"</div><div><span style="font-size: 10.5pt; line-height: 1.5; background-color: transparent;">sleep 2100</span></div><div>echo "step 3 over"</div><div>date</div></div><div>=========================</div><div>If I get rid of srun and run sleep directly, the phenomenon is the same.</div><div>In addition, I did not enable the two parameters of MpiDefault and MpiParams in the configuration file slurm.conf.</div><div>so, what is the possible reason for this problem?</div><div><br></div>
<div><br></div><hr style="width: 210px; height: 1px;" color="#b5c4df" size="1" align="left">
<div><span><div style="MARGIN: 10px; FONT-FAMILY: verdana; FONT-SIZE: 10pt"><div>zhangtao102019@126.com</div></div></span></div>
<blockquote style="margin-Top: 0px; margin-Bottom: 0px; margin-Left: 0.5em"><div> </div><div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm"><div style="PADDING-RIGHT: 8px; PADDING-LEFT: 8px; FONT-SIZE: 12px;FONT-FAMILY:tahoma;COLOR:#000000; BACKGROUND: #efefef; PADDING-BOTTOM: 8px; PADDING-TOP: 8px"><div><b>From:</b> <a href="mailto:artpol84@gmail.com">Artem Polyakov</a></div><div><b>Date:</b> 2018-08-22 06:02</div><div><b>To:</b> <a href="mailto:slurm-users@lists.schedmd.com">Slurm User Community List</a></div><div><b>CC:</b> <a href="mailto:slurm-users@schedmd.com">slurm-users</a></div><div><b>Subject:</b> Re: [slurm-users] Job cannot start on slurm v18.08.0pre2</div></div></div><div><div class="FoxDiv20180823090545530488"><div dir="ltr">Hello,<div><br></div><div>I can try to tell from PMIx/UCX perspective.</div><div>Do you have "MPI=pmix" parameter in your slurm.conf or have you specified "--mpi=pmix" in your srun command? If not - you are not running PMIx and thus UCX (UCX support is only in the PMIx plugin).</div><div>I think this is confirmed by the log output that you have provided, I don't see any traces of PMIx plugin.</div></div><br><div class="gmail_quote"><div dir="ltr">пт, 17 авг. 2018 г. в 20:43, <a href="mailto:zhangtao102019@126.com">zhangtao102019@126.com</a> <<a href="mailto:zhangtao102019@126.com">zhangtao102019@126.com</a>>:<br></div><blockquote class="gmail_quote" style="margin: 0px 0px 0px 0.5em; border-left-width: 1px; border-left-color: rgb(204, 204, 204); border-left-style: solid; padding-left: 1ex;"><div>
<div><span></span><div><div>Hi,</div><div>I have installed SLURM 18.08.0-0pre2 on a my cluster based on RHEL7.4 (x86_64).</div><div>My configure parameters likes this: </div><div>./configure --prefix=/opt/slurm17 --with-munge=/opt/munge --with-pmix=/opt/pmix --with-ucx=/opt/openucx --with-hwloc=/usr </div><div>(openucx version is 1.5.0, pmix version is 3.0.0, hwloc version is 1.11.8)</div><div><br></div><div>After completing the installation and configuration, it looks like slurm is working normally. But when I submitted a simple test job with sbatch sleep.sh(just call srun sleep 30 at single computing node), I found that the job (ID=1032) state was R, but <span style="font-size:10.5pt;line-height:1.5;background-color:transparent">the job did not start normally on the computation node (no process found).</span></div></div><div><br></div><div><div>The appendix is the output log of the computing node of the management node.</div><div>I can't tell if the cause of this problem is related to the compilation parameters I specify (such as pmix, ucx), and I've never seen anything similar in earlier versions.</div><div>Has anyone ever responded to a similar phenomenon with me? How to solve the problem? </div><div><br></div></div><div>Best regards</div></div>
<div><br></div><hr style="width:210px;height:1px" color="#b5c4df" size="1" align="left">
<div><span><div style="MARGIN:10px;FONT-FAMILY:verdana;FONT-SIZE:10pt"><div><a href="mailto:zhangtao102019@126.com" target="_blank">zhangtao102019@126.com</a></div></div></span></div>
</div></blockquote></div><br clear="all"><div><br></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature">С Уважением, Поляков Артем Юрьевич<br>Best regards, Artem Y. Polyakov</div>
</div></div></blockquote>
</div></div></blockquote>
</body></html>