<div dir="ltr"><span style="color:rgb(33,33,33);font-size:13px">I have a problem detecting RAM and Arch (maybe some more), check this...</span><div style="color:rgb(33,33,33);font-size:13px"><br></div><div style="color:rgb(33,33,33);font-size:13px"><div>NodeName=fisesta-21-3 Arch=x86_64 CoresPerSocket=1</div><div>   CPUAlloc=0 CPUErr=0 CPUTot=2 CPULoad=0.01</div><div>   AvailableFeatures=rack-21,2CPUs</div><div>   ActiveFeatures=rack-21,2CPUs</div><div>   Gres=gpu:1</div><div>   NodeAddr=10.1.21.3 NodeHostName=fisesta-21-3 Version=16.05</div><div>   OS=Linux RealMemory=3950 AllocMem=0 FreeMem=0 Sockets=2 Boards=1</div><div>   State=IDLE ThreadsPerCore=1 TmpDisk=259967 Weight=20479797 Owner=N/A MCS_label=N/A</div><div>   BootTime=2017-10-30T16:39:22 SlurmdStartTime=2017-11-06T16:46:54</div><div>   CapWatts=n/a</div><div>   CurrentWatts=0 LowestJoules=0 ConsumedJoules=0</div><div>   ExtSensorsJoules=n/s ExtSensorsWatts=0 ExtSensorsTemp=n/s</div><div><br></div><div><br></div><div>NodeName=fisesta-21-3-cpus CoresPerSocket=1</div><div>   CPUAlloc=0 CPUErr=0 CPUTot=6 CPULoad=0.01</div><div>   AvailableFeatures=rack-21,6CPUs</div><div>   ActiveFeatures=rack-21,6CPUs</div><div>   Gres=(null)</div><div>   NodeAddr=10.1.21.3 NodeHostName=fisesta-21-3-cpus Version=(null)</div><div>   RealMemory=1 AllocMem=0 FreeMem=0 Sockets=6 Boards=1</div><div>   State=IDLE ThreadsPerCore=1 TmpDisk=0 Weight=20483797 Owner=N/A MCS_label=N/A</div><div>   BootTime=None SlurmdStartTime=None</div><div>   CapWatts=n/a</div><div>   CurrentWatts=0 LowestJoules=0 ConsumedJoules=0</div><div>   ExtSensorsJoules=n/s ExtSensorsWatts=0 ExtSensorsTemp=n/s</div><div><br></div><div><br></div><div>For your problem, please share the important lines of nodes and partitions, you should check your users have permission to run inside very partition / node splitted by this new configuration</div></div><div class="GmSign"><div dir="ltr"><div><br></div><img src="http://gearinvent.com/img/bcard_gonzalo.png" width="420" height="233"><div><b style="font-size:x-small">Este mensaje es confidencial. Puede contener información amparada por el secreto comercial. Si usted ha recibido este e-mail por error, deberá eliminarlo de su sistema. No deberá copiar el mensaje ni divulgar su contenido a ninguna persona. Muchas gracias.</b><br style="font-size:x-small"><span style="font-size:x-small">This message is confidential. It may also contain information that is privileged or not authorized to be disclosed. If you have received it by mistake, delete it from your system. </span><span style="font-size:x-small">You should not copy the messsage nor disclose its contents to anyone. T</span><span style="font-size:x-small">hanks.</span><br></div></div></div><br><div class="gmail_quote"><div dir="ltr">El mar., 21 de nov. de 2017 a la(s) 11:05, Markus Köberl <<a href="mailto:markus.koeberl@tugraz.at">markus.koeberl@tugraz.at</a>> escribió:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">On Tuesday, 21 November 2017 10:26:53 CET Merlin Hartley wrote:<br>
> Could you give us your submission command?<br>
> It may be that you are requesting the wrong partition - i.e. relying on the<br>
> default partition selection… try with “--partition cpu”<br>
<br>
I run the following commands:<br>
<br>
srun --gres=gpu --mem-per-cpu="5G" -w gpu1 --pty /bin/bash<br>
-> works, partition gpu<br>
<br>
srun --mem-per-cpu="5G" -p cpu --pty /bin/bash<br>
-> works, I get a slot on another node which has only one NodeName entry.<br>
<br>
srun --mem-per-cpu="5G" -p cpu -w gpu1-cpu --pty /bin/bash<br>
-> error: Invalid job credential...<br>
<br>
srun --mem-per-cpu="5G" -p cpu -w gpu1 --pty /bin/bash<br>
-> error not in partition...<br>
<br>
<br>
I am using the following options:<br>
<br>
EnforcePartLimits=ANY<br>
GresTypes=gpu<br>
JobSubmitPlugins=all_partitions<br>
ProctrackType=proctrack/cgroup<br>
ReturnToService=2<br>
TaskPlugin=task/cgroup<br>
TrackWCKey=yes<br>
InactiveLimit=3600<br>
KillWait=1800<br>
MinJobAge=600<br>
OverTimeLimit=600<br>
SlurmctldTimeout=120<br>
SlurmdTimeout=300<br>
Waittime=0<br>
DefMemPerCPU=1000<br>
FastSchedule=1<br>
SchedulerType=sched/backfill<br>
SelectType=select/cons_res<br>
SelectTypeParameters=CR_Core_Memory<br>
PriorityFlags=ACCRUE_ALWAYS,FAIR_TREE,SMALL_RELATIVE_TO_TIME<br>
PriorityType=priority/multifactor<br>
PriorityDecayHalfLife=7-0<br>
PriorityFavorSmall=YES<br>
PriorityWeightAge=50<br>
PriorityWeightFairshare=25<br>
PriorityWeightJobSize=50<br>
PriorityWeightPartition=100<br>
PriorityWeightTRES=CPU=1000,Mem=2000,Gres/gpu=3000<br>
AccountingStorageEnforce=associations,limits,qos,WCKey<br>
AccountingStorageType=accounting_storage/slurmdbd<br>
AccountingStoreJobComment=YES<br>
AccountingStorageTRES=CPU,Mem,Gres/gpu<br>
JobAcctGatherFrequency=30<br>
JobAcctGatherType=jobacct_gather/cgroup<br>
<br>
<br>
regards<br>
Markus Köberl<br>
--<br>
Markus Koeberl<br>
Graz University of Technology<br>
Signal Processing and Speech Communication Laboratory<br>
E-mail: <a href="mailto:markus.koeberl@tugraz.at" target="_blank">markus.koeberl@tugraz.at</a><br>
<br>
</blockquote></div></div><div dir="ltr">-- <br></div><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr">Ing. Gonzalo Arroyo</div></div>