<div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div>We noticed that the slurm controller will remove nodes that it cannot reach.</div><div>How can this be disabled?</div><div>We would like to see the nodes marked down/drain instead of the controller removing the nodes from sinfo.</div><div><br></div><div>/var/log/slurm/slurmctld.log<br></div><div>[2022-10-25T13:10:01.500] debug:  Log file re-opened<br></div><div>[2022-10-25T13:10:01.589] error: get_addr_info: getaddrinfo() failed: Temporary failure in name resolution</div><div>[2022-10-25T13:10:01.589] error: slurm_set_addr: Unable to resolve "spg-ethx-f4ce"</div><div>[2022-10-25T13:10:01.589] error: slurm_get_port: Address family '0' not supported</div><div>[2022-10-25T13:10:01.589] error: _set_slurmd_addr: failure on spg-ethx-f4ce</div><div><br></div><div><div>cat /etc/slurm/slurm.conf | grep -i f4ce</div><div>NodeName=spg-ethx-f4ce ...<br></div></div><div>PartitionName=debug spg-ethx-f4ce ...<br></div><div><br></div><div>No output in sinfo:</div><div>sinfo -N | grep f4ce<br></div><div>sinfo -R | grep f4ce<br></div><div><br></div><div><div>slurmd -V</div><div>slurm 21.08.0</div></div></div></div></div></div></div></div></div></div></div>