<div dir="ltr"><div>Thank you for that, Ole! I will give them a spin on our cluster and send any feedback to GitHub.</div><div><br></div><div>Cheers,<br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Jan 18, 2021 at 4:12 PM Ole Holm Nielsen <<a href="mailto:Ole.H.Nielsen@fysik.dtu.dk">Ole.H.Nielsen@fysik.dtu.dk</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">FYI: My Slurm tools for displaying batch job user process information have <br>
been updated.  Besides the user process list from "ps", a summary of the <br>
number of processes and threads is now printed as well.  We use this for <br>
monitoring the sanity of user jobs.  For example, we often see jobs that <br>
run too many threads per process and overload the CPUs.<br>
<br>
The tools are:<br>
<br>
* psjob <jobid>      for all user processes in a job<br>
* psnode <nodelist>  for all user processes on a node or list of nodes<br>
<br>
Download the psjob and psnode tools from:<br>
<a href="https://github.com/OleHolmNielsen/Slurm_tools/tree/master/jobs" rel="noreferrer" target="_blank">https://github.com/OleHolmNielsen/Slurm_tools/tree/master/jobs</a><br>
<a href="https://github.com/OleHolmNielsen/Slurm_tools/tree/master/nodes" rel="noreferrer" target="_blank">https://github.com/OleHolmNielsen/Slurm_tools/tree/master/nodes</a><br>
<br>
-- <br>
Ole Holm Nielsen<br>
PhD, Senior HPC Officer<br>
Department of Physics, Technical University of Denmark<br>
<br>
</blockquote></div><br clear="all"><br>-- <br><div dir="ltr" class="gmail_signature"><div dir="ltr"><div>Alan Orth<br><a href="mailto:alan.orth@gmail.com" target="_blank">alan.orth@gmail.com</a><br><a href="https://picturingjordan.com" target="_blank">https://picturingjordan.com</a><br><a href="https://englishbulgaria.net" target="_blank">https://englishbulgaria.net</a><br><a href="https://mjanja.ch" target="_blank">https://mjanja.ch</a></div></div></div>