<div dir="ltr">All,<div><br></div><div>I have slurmdbd running and everything is (mostly) happy. It's been working well for months, but fairly regularly, when I do 'sacctmgr show runaway jobs', I get:</div><div><br></div><div><b><i>sacctmgr: error: Slurmctld running on cluster orion is not up, can't check running jobs</i></b><br></div><div><br></div><div>if I do 'sacctmgr show cluster', it lists the cluster but has no IP in the ControlHost field.</div><div><br></div><div>slurmctld is most definitely running (on the same system even), but the only fix I find is to restart slurmctld. Then I can check and there is an IP in the ControlHost field and I am able to check for runawayjobs.</div><div><br></div><div>Is this a known issue? Is there a better fix than restarting slurmctld?</div><div><br></div><div>Brian Andrus</div></div>