<div dir="ltr"><div>Matthew, that deserves an explanation. Bright Computing Proof of Concept causes nightmares?</div><div>That is a pretty strong assertion. Please give more details.<br></div></div><br><div class="gmail_quote"><div class="gmail_attr" dir="ltr">On Wed, 13 Feb 2019 at 16:01, Matthew BETTINGER <<a href="mailto:matthew.bettinger@external.total.com">matthew.bettinger@external.total.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;padding-left:1ex;border-left-color:rgb(204,204,204);border-left-width:1px;border-left-style:solid">One of the main guy Panos left Bright so no answer to your specific question but I hope you can get some support with it.  We dumped our BC PoC,  the sysadmin working on the PoC still has nightmares.<br>
<br>
On 2/13/19, 6:54 AM, "slurm-users on behalf of John Hearns" <<a href="mailto:slurm-users-bounces@lists.schedmd.com" target="_blank">slurm-users-bounces@lists.schedmd.com</a> on behalf of <a href="mailto:hearnsj@googlemail.com" target="_blank">hearnsj@googlemail.com</a>> wrote:<br>
<br>
    Yugendra,  the Bright support guys are excellent. <br>
    Slurm is their default choice. I would ask again. Yes, Slurm is technically out of scope for them, but they shoudl help a bit.<br>
<br>
<br>
    By the way, I think your problem is that you have configured authentication using AD on your head node.<br>
    BUT you have not confiured it ont he compute node images. You probably have to prepare a new compute node image then push that otu to the compute nodes.<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
    On Wed, 13 Feb 2019 at 12:35, Yugendra Guvvala <<a href="mailto:yguvvala@cambridgecomputer.com" target="_blank">yguvvala@cambridgecomputer.com</a>> wrote:<br>
<br>
<br>
    Also reached out to bright computing support and they say slurm is out of scope for them. <br>
<br>
    Thanks,<br>
    Yugi<br>
<br>
<br>
    On Feb 13, 2019, at 7:27 AM, Antony Cleave <<a href="mailto:antony.cleave@gmail.com" target="_blank">antony.cleave@gmail.com</a>> wrote:<br>
<br>
<br>
<br>
    can you ssh to the compute node that job was trying to run on as as the AD user in question?<br>
<br>
<br>
    I've  seen similar issues on AD integrated systems where some nodes boot from a different image that have not yet been joined to the domain.<br>
<br>
<br>
    Antony<br>
<br>
<br>
    On Wed, 13 Feb 2019 at 04:58, Yugendra Guvvala <<a href="mailto:yguvvala@cambridgecomputer.com" target="_blank">yguvvala@cambridgecomputer.com</a>> wrote:<br>
<br>
<br>
    Hi, <br>
<br>
<br>
    We are bringing a new cluster online. We installed SLURM through Bright Cluster Manager how ever we are running into a issue here. <br>
<br>
<br>
    We are able to run jobs as root user and users created using bright cluster (cmsh commands). How ever we use AD authentication for all our users and when we try to submit jobs to slurm using AD users we are getting following error message. <br>
<br>
<br>
<br>
<br>
    srun: fatal: Invalid user id: 10952<br>
    srun: fatal: Invalid user id: 10952<br>
    srun: error: cnode001: task 0: Exited with exit code 1<br>
<br>
<br>
<br>
    Attached is the slurm.con file for reference. Please let us know if you have any insight into this. <br>
<br>
<br>
<br>
<br>
<br>
<br>
    Thanks, <br>
    Yugi<br>
<br>
<br>
    Yugendra Guvvala | HPC Technologist  | Cambridge Computer  | "Artists<br>
     in Data Storage" <br>
    Direct: 781-250-3273  | Cell: 806-773-4464  | <a href="mailto:yguvvala@cambridgecomputer.com" target="_blank">yguvvala@cambridgecomputer.com</a>  | <a href="http://www.cambridgecomputer.com" target="_blank" rel="noreferrer">www.cambridgecomputer.com</a> <<a href="http://www.cambridgecomputer.com" target="_blank" rel="noreferrer">http://www.cambridgecomputer.com</a>><br>
<br>
<br>
    _______________________________________________________________________________________________<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
</blockquote></div>