<div dir="ltr">$ systemctl status slurmdbd<br>● slurmdbd.service - Slurm DBD accounting daemon<br>   Loaded: loaded (/etc/systemd/system/slurmdbd.service; enabled; vendor preset: enabled)<br>   Active: failed (Result: exit-code) since Tue 2019-12-10 13:33:28 MST; 40min ago<br>  Process: 787 ExecStart=/usr/sbin/slurmdbd $SLURMDBD_OPTIONS (code=exited, status=0/SUCCESS)<br> Main PID: 791 (code=exited, status=1/FAILURE)<br><br>Dec 10 13:33:28 <a href="http://ubuntu-controller.liqid.com">ubuntu-controller.liqid.com</a> systemd[1]: Starting Slurm DBD accounting daemon...<br>Dec 10 13:33:28 <a href="http://ubuntu-controller.liqid.com">ubuntu-controller.liqid.com</a> systemd[1]: Started Slurm DBD accounting daemon.<br>Dec 10 13:33:28 <a href="http://ubuntu-controller.liqid.com">ubuntu-controller.liqid.com</a> slurmdbd[791]: fatal: Unable to initialize accounting_storage/mysql accounting storage plugin<br>Dec 10 13:33:28 <a href="http://ubuntu-controller.liqid.com">ubuntu-controller.liqid.com</a> systemd[1]: slurmdbd.service: Main process exited, code=exited, status=1/FAILURE<br>Dec 10 13:33:28 <a href="http://ubuntu-controller.liqid.com">ubuntu-controller.liqid.com</a> systemd[1]: slurmdbd.service: Failed with result 'exit-code'.<br>$ systemctl status slurmctld<br>● slurmctld.service - Slurm controller daemon<br>   Loaded: loaded (/etc/systemd/system/slurmctld.service; enabled; vendor preset: enabled)<br>   Active: failed (Result: exit-code) since Tue 2019-12-10 13:33:28 MST; 41min ago<br>  Process: 788 ExecStart=/usr/sbin/slurmctld $SLURMCTLD_OPTIONS (code=exited, status=0/SUCCESS)<br> Main PID: 796 (code=exited, status=1/FAILURE)<br><br>Dec 10 13:33:28 <a href="http://ubuntu-controller.liqid.com">ubuntu-controller.liqid.com</a> systemd[1]: Starting Slurm controller daemon...<br>Dec 10 13:33:28 <a href="http://ubuntu-controller.liqid.com">ubuntu-controller.liqid.com</a> systemd[1]: Started Slurm controller daemon.<br>Dec 10 13:33:28 <a href="http://ubuntu-controller.liqid.com">ubuntu-controller.liqid.com</a> slurmctld[796]: fatal: You are running with a database but for some reason we have no TRES from it.  Th<br>Dec 10 13:33:28 <a href="http://ubuntu-controller.liqid.com">ubuntu-controller.liqid.com</a> systemd[1]: slurmctld.service: Main process exited, code=exited, status=1/FAILURE<br>Dec 10 13:33:28 <a href="http://ubuntu-controller.liqid.com">ubuntu-controller.liqid.com</a> systemd[1]: slurmctld.service: Failed with result 'exit-code'.<br>$ <br><div><br></div><div>One issue is with a database plugin.  During database setup this command failed:</div><div><br></div><div>sudo systemctl enable mysql</div><div><br></div><div>I did this instead</div><div><br></div><div>sudo systemctl enable mariadb.service</div><div><br></div><div>Maybe there is some config that has to be modified to use maria instead  of mysql?</div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Dec 10, 2019 at 2:13 PM Renfro, Michael <<a href="mailto:Renfro@tntech.edu">Renfro@tntech.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">What do you get from<br>
<br>
systemctl status slurmdbd<br>
systemctl status slurmctld<br>
<br>
I’m assuming at least slurmdbd isn’t running.<br>
<br>
> On Dec 10, 2019, at 3:05 PM, Dean Schulze <<a href="mailto:dean.w.schulze@gmail.com" target="_blank">dean.w.schulze@gmail.com</a>> wrote:<br>
> <br>
> External Email Warning<br>
> This email originated from outside the university. Please use caution when opening attachments, clicking links, or responding to requests.<br>
> I'm trying to set up my first slurm installation following these instructions:<br>
> <br>
> <a href="https://github.com/nateGeorge/slurm_gpu_ubuntu" rel="noreferrer" target="_blank">https://github.com/nateGeorge/slurm_gpu_ubuntu</a><br>
> <br>
> I've had to deviate a little bit because I'm using virtual machines that don't have GPUs, so I don't have a gres.conf file and in /etc/slurm/slurm.conf I don't have an entry like Gres=gpu:2 on the last line.<br>
> <br>
> On my controller vm I get errors when trying to do simple commnands:<br>
> <br>
> $ sinfo<br>
> slurm_load_partitions: Unable to contact slurm controller (connect failure)<br>
> <br>
> $ sudo sacctmgr add cluster compute-cluster<br>
> sacctmgr: error: slurm_persist_conn_open_without_init: failed to open persistent connection to localhost:6819: Connection refused<br>
> sacctmgr: error: slurmdbd: Sending PersistInit msg: Connection refused<br>
> sacctmgr: error: Problem talking to the database: Connection refused<br>
> <br>
> <br>
> Something is supposed to be running on port 6819, but netstat shows nothing using that port.  What is supposed to be running on 6819?<br>
> <br>
> My database (Maria) is running.  I can connect to it with `sudo mysql -U root`.<br>
> <br>
> When I boot my controller which services are supposed to be running and on which ports?<br>
> <br>
> Thanks.<br>
> <br>
<br>
</blockquote></div>