<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        font-size:12.0pt;
        font-family:"Calibri",sans-serif;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:12.0pt;
        font-family:"Calibri",sans-serif;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt">Any idea why pam_slurm_adopt would work on some nodes but not others? Here is an excerpt from one of the nodes:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Jan 28 15:38:54 dgx1-1 sshd[1027640]: pam_sss(sshd:auth): authentication success; logname= uid=0 euid=0 tty=ssh ruser= rhost=10.10.10.1 user=test.user<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Jan 28 15:38:54 dgx1-1 pam_slurm_adopt[1027640]: debug2: _establish_config_source: using config_file=/admin/slurm/slurm-21.08.5/etc/slurm.conf (default)<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Jan 28 15:38:54 dgx1-1 pam_slurm_adopt[1027640]: debug:  slurm_conf_init: using config_file=/admin/slurm/slurm-21.08.5/etc/slurm.conf<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Jan 28 15:38:54 dgx1-1 pam_slurm_adopt[1027640]: debug:  Reading slurm.conf file: /admin/slurm/slurm-21.08.5/etc/slurm.conf<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Jan 28 15:38:54 dgx1-1 pam_slurm_adopt[1027640]: debug:  Reading cgroup.conf file /admin/slurm/slurm-21.08.5/etc/cgroup.conf<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Jan 28 15:38:54 dgx1-1 pam_slurm_adopt[1027640]: debug4: found StepId=182409.0<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Jan 28 15:38:54 dgx1-1 pam_slurm_adopt[1027640]: send_user_msg: Access denied by pam_slurm_adopt: you have no active jobs on this node<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Jan 28 15:38:54 dgx1-1 sshd[1027640]: pam_access(sshd:account): access denied for user `test.user' from `10.10.10.1'<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Squeue:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">182409      v100     bash test.user  R    1:43:58      1 dgx1-1<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">Other nodes using the exact same config seem to work just fine. The debug doesn’t show much information. Could this be related to cgroups/adoption? Where could I get more information? The only difference I
 can think of is the nodes that are working seem to be built more recently than the others, but are patched to the same levels and get the same config.<o:p></o:p></span></p>
</div>
</body>
</html>