<div dir="ltr">I am trying what you said, but I am having new and earlier problems. For example, now munge does not start.<br><br><div style="margin-left:40px">$ sudo systemctl enable munge<br>Synchronizing state of munge.service with SysV init with /lib/systemd/systemd-sysv-install...<br>Executing /lib/systemd/systemd-sysv-install enable munge<br>Failed to execute operation: File exists<br></div><br>I really think I mangled my system because I tried so many different things. Is there a way to start fresh without reinstalling my OS?<br><br></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><a href="http://will-landau.com" target="_blank">will-landau.com</a><br><span><div><div dir="ltr"><div><a href="http://linkedin.com/in/wlandau" target="_blank"><span><span>linkedin.com/in/</span><span>wlandau</span></span></a><br><a href="https://github.com/wlandau" target="_blank">github.com/wlandau</a><br></div></div></div></span></div></div></div></div></div></div></div></div></div>
<br><div class="gmail_quote">On Thu, Nov 9, 2017 at 3:04 AM, Raymond Wan <span dir="ltr"><<a href="mailto:rwan.work@gmail.com" target="_blank">rwan.work@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Will,<br>
<span class=""><br>
<br>
On Thu, Nov 9, 2017 at 11:01 AM, Will L <<a href="mailto:will.landau@gmail.com">will.landau@gmail.com</a>> wrote:<br>
><br>
> Thanks for the suggestions. Munge seems to be working just fine. At one point I tried to build SLURM from the source, but when I could not make it work, I `sudo make uninstall`ed it and opted for the pre-built apt version all over again. Maybe that made a mess. What should I do to make SLURM notice munge and other utilities?<br>
<br>
<br>
</span>Yes, that wasn't probably a good idea.  I've had SLURM working on a<br>
single computer since Ubuntu 15.04 or 15.10 using the packages without<br>
a lot of problems.  I haven't had to turn to installing from source<br>
[yet]...<br>
<br>
During the setup of munge, you ran commands such as this:<br>
<br>
sudo create-munge-key -f -r<br>
sudo systemctl enable munge<br>
sudo systemctl start munge<br>
<br>
(I guess the third line doesn't matter if you reboot.)<br>
<br>
So, after you rebooted, did you see /usr/sbin/munged running and owned<br>
by the munge user?<br>
<span class=""><br>
<br>
> Also, here is my current slurm.conf.<br>
<br>
<br>
</span>One issue I had with the SLURM packages for Ubuntu (especially 1-2<br>
years ago) was that the configurator at<br>
/usr/share/doc/slurmctld/<wbr>slurm-wlm-configurator.html did *not* match<br>
the version I was installing.  So I actually ended up using a<br>
web-based configurator.<br>
<br>
I'm not sure if that's a big problem...<br>
<br>
Another problem with the "older" [*] SLURM packages for Ubuntu is that<br>
many directories are not created during the installation process.  So,<br>
in your configuration file, make sure all of the directories<br>
/var/run/... /var/log/... have all been created and accessible by the<br>
slurm user, at least.  First ensure that the log directories are<br>
created...once they are, watch the log files when you do:<br>
<br>
sudo service slurmctld start<br>
sudo service slurmd start<br>
<br>
and it'll tell you what directories are missing.  Actually, once you<br>
get to the point where there are log files being generated, you're not<br>
only close, but posting the error message might help us help you<br>
better.<br>
<br>
This is what comes to mind; I hope this helps!<br>
<br>
Ray<br>
<br>
[*]  I'm currently on Ubuntu 17.10 and the SLURM packages for that<br>
version.  Ubuntu 16.04 is fine, but I haven't kept track of what has<br>
changed / improved in terms of the SLURM packages...<br>
<br>
</blockquote></div><br></div>