<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><meta http-equiv=Content-Type content="text/html; charset=utf-8"><meta name=Generator content="Microsoft Word 15 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Hack;
        panose-1:2 11 6 9 3 2 2 2 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;
        mso-ligatures:standardcontextual;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
p.p1, li.p1, div.p1
        {mso-style-name:p1;
        margin:0in;
        font-size:11.5pt;
        font-family:Hack;
        color:black;}
span.s1
        {mso-style-name:s1;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style></head><body lang=EN-US link="#0563C1" vlink="#954F72" style='word-wrap:break-word'><div class=WordSection1><p class=MsoNormal>The SlurmctldHost value is set like the following in my slurm.conf:<o:p></o:p></p><p class=MsoNormal><o:p> </o:p></p><p class=p1><span class=s1>SlurmctldHost=host0,host1</span><o:p></o:p></p><p class=MsoNormal><o:p> </o:p></p><p class=MsoNormal>That seems to be legal according to the documentation. However, I get error messages like the following:<o:p></o:p></p><p class=MsoNormal><o:p> </o:p></p><p class=p1><span class=s1>$ srun id</span><o:p></o:p></p><p class=p1><span class=s1>srun: error: get_addr_info: getaddrinfo() failed: Name or service not known</span><o:p></o:p></p><p class=p1><span class=s1>srun: error: slurm_set_addr: Unable to resolve "host0,host1"</span><o:p></o:p></p><p class=p1><span class=s1>srun: error: Unable to establish control machine address</span><o:p></o:p></p><p class=p1><span class=s1>srun: error: Unable to allocate resources: Address already in use</span><o:p></o:p></p><p class=MsoNormal><o:p> </o:p></p><p class=MsoNormal>If I try to put IP addresses in parentheses per the documentation, I get different errors:<o:p></o:p></p><p class=MsoNormal><o:p> </o:p></p><p class=p1><span class=s1>$ srun id</span><o:p></o:p></p><p class=p1><span class=s1>srun: error: Bad value "host0(12.34.56.78),host1" for SlurmctldHost</span><o:p></o:p></p><p class=p1><span class=s1>srun: error: No SlurmctldHost defined.</span><o:p></o:p></p><p class=p1><span class=s1>srun: fatal: Unable to process configuration file</span><o:p></o:p></p><p class=MsoNormal><o:p> </o:p></p><p class=MsoNormal>If I put a single hostname, or a hostname with an address in parentheses as the value for SlurmctldHost, it works fine but I have no failover.<o:p></o:p></p><p class=MsoNormal><o:p> </o:p></p><p class=MsoNormal>I’m running 23.02.6:<o:p></o:p></p><p class=MsoNormal><o:p> </o:p></p><p class=p1><span class=s1>$ sinfo --version</span><o:p></o:p></p><p class=p1><span class=s1>slurm 23.02.6</span><o:p></o:p></p><p class=MsoNormal><o:p> </o:p></p><p class=MsoNormal>What’s going on?<o:p></o:p></p><p class=MsoNormal><o:p> </o:p></p><div><div><p class=MsoNormal><span style='mso-ligatures:none'>-- <o:p></o:p></span></p></div></div><p class=MsoNormal><span style='mso-ligatures:none'>Gary</span><o:p></o:p></p></div></body></html>