<div dir="ltr"><div dir="ltr">Hi, slurm-users and mercan.<div><br>I tried what you said.</div><div><pre style="font-size:13px;white-space:pre-wrap;margin-top:0px;margin-bottom:1em;padding:12px 8px;border:0px;font-variant-numeric:inherit;font-variant-east-asian:inherit;font-stretch:inherit;line-height:inherit;font-family:Consolas,Menlo,Monaco,"Lucida Console","Liberation Mono","DejaVu Sans Mono","Bitstream Vera Sans Mono","Courier New",monospace,sans-serif;vertical-align:baseline;box-sizing:inherit;width:auto;max-height:600px;overflow:auto;background-color:rgb(239,240,241);border-radius:3px;color:rgb(36,39,41)"><code style="margin:0px;padding:0px;border:0px;font-style:inherit;font-variant:inherit;font-weight:inherit;font-stretch:inherit;line-height:inherit;font-family:Consolas,Menlo,Monaco,"Lucida Console","Liberation Mono","DejaVu Sans Mono","Bitstream Vera Sans Mono","Courier New",monospace,sans-serif;vertical-align:baseline;box-sizing:inherit;white-space:inherit">noki@noki-System-Product-Name:~$ sudo chown -R noki:root /var/spool/slurm-llnl/
</code>noki@noki-System-Product-Name:/var/spool/slurm-llnl$ ls -l<br>total 92<br>-rw------- 1 noki root 198 Jun 19 11:36 assoc_mgr_state<br>-rw------- 1 noki root 198 Jun 18 20:31 assoc_mgr_state.old<br>-rw------- 1 noki root  10 Jun 19 11:36 assoc_usage<br>-rw------- 1 noki root  10 Jun 18 20:31 assoc_usage.old<br>-rw-r--r-- 1 noki root   5 Jun 11 21:15 clustername<br>-rw------- 1 noki root  15 Jun 19 11:36 fed_mgr_state<br>-rw------- 1 noki root  15 Jun 18 20:31 fed_mgr_state.old<br>-rw------- 1 noki root  35 Jun 19 11:36 job_state<br>-rw------- 1 noki root  35 Jun 18 20:31 job_state.old<br>-rw------- 1 noki root  38 Jun 19 11:36 last_config_lite<br>-rw------- 1 noki root  38 Jun 19  2019 last_config_lite.old<br>-rw------- 1 noki root 109 Jun 19 11:36 layouts_state_base<br>-rw------- 1 noki root 109 Jun 18 20:31 layouts_state_base.old<br>-rw------- 1 noki root 194 Jun 19 11:36 node_state<br>-rw------- 1 noki root 194 Jun 18 20:31 node_state.old<br>-rw------- 1 noki root 142 Jun 19 11:36 part_state<br>-rw------- 1 noki root 142 Jun 18 20:31 part_state.old<br>-rw------- 1 noki root  10 Jun 19 11:36 qos_usage<br>-rw------- 1 noki root  10 Jun 18 20:31 qos_usage.old<br>-rw------- 1 noki root  35 Jun 19 11:36 resv_state<br>-rw------- 1 noki root  35 Jun 18 20:31 resv_state.old<br>-rw------- 1 noki root  31 Jun 19 11:36 trigger_state<br>-rw------- 1 noki root  31 Jun 18 20:31 trigger_state.old</pre><div>After I restarted or not both slurmd and slrumctld, slurmctld is fine but slurmd still shows the same issue.<br>The below is the owners and groups after restart both slurmd and slurmctld<br></div></div><div><pre style="font-size:13px;white-space:pre-wrap;margin-top:0px;margin-bottom:1em;padding:12px 8px;border:0px;font-variant-numeric:inherit;font-variant-east-asian:inherit;font-stretch:inherit;line-height:inherit;font-family:Consolas,Menlo,Monaco,"Lucida Console","Liberation Mono","DejaVu Sans Mono","Bitstream Vera Sans Mono","Courier New",monospace,sans-serif;vertical-align:baseline;box-sizing:inherit;width:auto;max-height:600px;overflow:auto;background-color:rgb(239,240,241);border-radius:3px;color:rgb(36,39,41)"><code style="margin:0px;padding:0px;border:0px;font-style:inherit;font-variant:inherit;font-weight:inherit;font-stretch:inherit;line-height:inherit;font-family:Consolas,Menlo,Monaco,"Lucida Console","Liberation Mono","DejaVu Sans Mono","Bitstream Vera Sans Mono","Courier New",monospace,sans-serif;vertical-align:baseline;box-sizing:inherit;white-space:inherit">noki@noki-System-Product-Name:~$ sudo chown -R noki:root /var/spool/slurm-llnl/
noki@noki-System-Product-Name:/var/spool/slurm-llnl$ ls -l<br>total 92<br>-rw------- 1 noki noki 198 Jun 19 11:40 assoc_mgr_state<br>-rw------- 1 noki root 198 Jun 19 11:36 assoc_mgr_state.old<br>-rw------- 1 noki noki  10 Jun 19 11:40 assoc_usage<br>-rw------- 1 noki root  10 Jun 19 11:36 assoc_usage.old<br>-rw-r--r-- 1 noki root   5 Jun 11 21:15 clustername<br>-rw------- 1 noki noki  15 Jun 19 11:40 fed_mgr_state<br>-rw------- 1 noki root  15 Jun 19 11:36 fed_mgr_state.old<br>-rw------- 1 noki noki  35 Jun 19 11:40 job_state<br>-rw------- 1 noki root  35 Jun 19 11:36 job_state.old<br>-rw------- 1 noki noki  38 Jun 19 11:40 last_config_lite<br>-rw------- 1 noki root  38 Jun 19 11:36 last_config_lite.old<br>-rw------- 1 noki noki 109 Jun 19 11:40 layouts_state_base<br>-rw------- 1 noki root 109 Jun 19 11:36 layouts_state_base.old<br>-rw------- 1 noki noki 194 Jun 19 11:40 node_state<br>-rw------- 1 noki root 194 Jun 19 11:36 node_state.old<br>-rw------- 1 noki noki 142 Jun 19 11:40 part_state<br>-rw------- 1 noki root 142 Jun 19 11:36 part_state.old<br>-rw------- 1 noki noki  10 Jun 19 11:40 qos_usage<br>-rw------- 1 noki root  10 Jun 19 11:36 qos_usage.old<br>-rw------- 1 noki noki  35 Jun 19 11:40 resv_state<br>-rw------- 1 noki root  35 Jun 19 11:36 resv_state.old<br>-rw------- 1 noki noki  31 Jun 19 11:40 trigger_state<br>-rw------- 1 noki root  31 Jun 19 11:36 trigger_state.old<br></code></pre>Do you think I need to change chmod?</div><div><br></div><div>Regards,<br></div><div><br></div></div><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Jun 18, 2019 at 9:27 PM mercan <<a href="mailto:ahmet.mercan@uhem.itu.edu.tr" target="_blank">ahmet.mercan@uhem.itu.edu.tr</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Hi;<br>
<br>
I did not notice<br>
<br>
SlurmUser=noki<br>
<br>
line. The owner of the /var/run/slurm-llnl directory and the <br>
slurmctld.pid and slurmd.pid files should be "noki" user.<br>
<br>
chown -R noki:root /var/spool/slurm-llnl<br>
<br>
Regards;<br>
<br>
Ahmet M.<br>
<br>
<br>
On 18.06.2019 15:15, mercan wrote:<br>
> Hi;<br>
><br>
> The owner of the /var/run/slurm-llnl directory and the slurmctld.pid <br>
> and slurmd.pid files should be "slurm" user. Your files owner are root <br>
> and noki.<br>
><br>
> chown -R slurm:slurm /var/spool/slurm-llnl<br>
><br>
><br>
> Regards;<br>
><br>
> Ahmet M.<br>
><br>
><br>
> On 18.06.2019 15:03, Noki Lee wrote:<br>
>><br>
>> Though SLURM works fine for job submitting, running, and queueing, I <br>
>> got a minor error below.<br>
>><br>
>> |sudo systemctl status slurmd|<br>
>><br>
>> |Jun 12 10:20:40 noki-System-Product-Name systemd[1]: slurmd.service: <br>
>> Can't open PID file /var/run/slurm-llnl/slurmd.pid (yet?) after <br>
>> start: No such file or directory|<br>
>><br>
>> |sudo systemctl status slurmctld|<br>
>><br>
>> |Jun 12 10:20:40 noki-System-Product-Name systemd[1]: slurmd.service: <br>
>> Can't open PID file /var/run/slurm-llnl/slurmd.pid (yet?) after <br>
>> start: No such file or directory|<br>
>><br>
>> I followed the installation of a guide from<br>
>><br>
>> <a href="ftp://www.microway.com/pub/pub/for-customer/SDSU-Training/Webinar_2_Slurm_II--Ubuntu16.04_and_18.04.pdf" rel="noreferrer" target="_blank">ftp://www.microway.com/pub/pub/for-customer/SDSU-Training/Webinar_2_Slurm_II--Ubuntu16.04_and_18.04.pdf</a> <br>
>><br>
>><br>
>> This problem may come from the ownership of slurm.conf file?<br>
>><br>
>> Here are my slurm.conf and ownership for slur*.pid<br>
>><br>
>> |# slurm.conf file generated by configurator easy.html. # Put this <br>
>> file on all nodes of your cluster. # See the slurm.conf man page for <br>
>> more information. # ControlMachine=noki-System-Product-Name <br>
>> #ControlAddr= # #MailProg=/bin/mail MpiDefault=none <br>
>> #MpiParams=ports=#-# ProctrackType=proctrack/pgid ReturnToService=1 <br>
>> SlurmctldPidFile=/var/run/slurm-llnl/slurmctld.pid <br>
>> #SlurmctldPort=6817 SlurmdPidFile=/var/run/slurm-llnl/slurmd.pid <br>
>> #SlurmdPort=6818 SlurmdSpoolDir=/var/spool/slurmd SlurmUser=noki <br>
>> #SlurmdUser=root StateSaveLocation=/var/spool/slurm-llnl <br>
>> SwitchType=switch/none TaskPlugin=task/none # # # TIMERS #KillWait=30 <br>
>> #MinJobAge=300 #SlurmctldTimeout=120 #SlurmdTimeout=300 # # # <br>
>> SCHEDULING FastSchedule=1 SchedulerType=sched/backfill <br>
>> SelectType=select/linear #SelectTypeParameters= # # # LOGGING AND <br>
>> ACCOUNTING AccountingStorageType=accounting_storage/none <br>
>> ClusterName=linux #JobAcctGatherFrequency=30 <br>
>> JobAcctGatherType=jobacct_gather/none #SlurmctldDebug=3 <br>
>> SlurmctldLogFile=/var/log/slurm-llnl/SlurmctldLogFile #SlurmdDebug=3 <br>
>> SlurmdLogFile=/var/log/slurm-llnl/SlurmdLogFile # # # COMPUTE NODES <br>
>> NodeName=noki-System-Product-Name CPUs=4 RealMemory=6963 Sockets=1 <br>
>> CoresPerSocket=4 ThreadsPerCore=1 State=UNKNOWN PartitionName=debug <br>
>> Nodes=noki-System-Product-Name Default=YES MaxTime=INFINITE State=UP |<br>
>> |$ ls -l /var/run/slurm-llnl/ total 8 -rw-r--r-- 1 noki root 6 Jun 12 <br>
>> 10:20 slurmctld.pid -rw-r--r-- 1 root root 6 Jun 12 10:20 slurmd.pid|<br>
>><br>
><br>
</blockquote></div>
</div>