<div dir="auto">Baja</div><div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">El El mié, 18 nov. 2020 a la(s) 09:00, <<a href="mailto:slurm-users-request@lists.schedmd.com">slurm-users-request@lists.schedmd.com</a>> escribió:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Send slurm-users mailing list submissions to<br>
        <a href="mailto:slurm-users@lists.schedmd.com" target="_blank">slurm-users@lists.schedmd.com</a><br>
<br>
To subscribe or unsubscribe via the World Wide Web, visit<br>
        <a href="https://lists.schedmd.com/cgi-bin/mailman/listinfo/slurm-users" rel="noreferrer" target="_blank">https://lists.schedmd.com/cgi-bin/mailman/listinfo/slurm-users</a><br>
or, via email, send a message with subject or body 'help' to<br>
        <a href="mailto:slurm-users-request@lists.schedmd.com" target="_blank">slurm-users-request@lists.schedmd.com</a><br>
<br>
You can reach the person managing the list at<br>
        <a href="mailto:slurm-users-owner@lists.schedmd.com" target="_blank">slurm-users-owner@lists.schedmd.com</a><br>
<br>
When replying, please edit your Subject line so it is more specific<br>
than "Re: Contents of slurm-users digest..."<br>
<br>
<br>
Today's Topics:<br>
<br>
   1. Just one node getting job allocations (La Pulga Encuera y Rabiosa)<br>
   2. Slurm version 20.11.0 is now available (Tim Wickberg)<br>
   3. Sreport Query (navin srivastava)<br>
   4. Re: Sreport Query (navin srivastava)<br>
<br>
<br>
----------------------------------------------------------------------<br>
<br>
Message: 1<br>
Date: Tue, 17 Nov 2020 10:50:17 -0500<br>
From: La Pulga Encuera y Rabiosa <<a href="mailto:lapulgaencuerayrabiosa@gmail.com" target="_blank">lapulgaencuerayrabiosa@gmail.com</a>><br>
To: "<a href="mailto:slurm-users@lists.schedmd.com" target="_blank">slurm-users@lists.schedmd.com</a>" <<a href="mailto:slurm-users@lists.schedmd.com" target="_blank">slurm-users@lists.schedmd.com</a>><br>
Subject: [slurm-users] Just one node getting job allocations<br>
Message-ID:<br>
        <<a href="mailto:CAP3Hg1G7msGsK8cFKCmAmmPoa45_HEKYUi18-xT7_uH-njSeBg@mail.gmail.com" target="_blank">CAP3Hg1G7msGsK8cFKCmAmmPoa45_HEKYUi18-xT7_uH-njSeBg@mail.gmail.com</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
And if I try to run another job and all resources in that one node are all<br>
used then the job is pur to pending. I'm running srun getting pseudo<br>
terminals allocations to install some Spack packages. this node has 40<br>
cores (2 sockets @20 cores each). same specs and memory size for the other<br>
nodes. Any clues where is the issue or where to start looking?<br>
<br>
Thank you all.<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://lists.schedmd.com/pipermail/slurm-users/attachments/20201117/9302134f/attachment-0001.htm" rel="noreferrer" target="_blank">http://lists.schedmd.com/pipermail/slurm-users/attachments/20201117/9302134f/attachment-0001.htm</a>><br>
<br>
------------------------------<br>
<br>
Message: 2<br>
Date: Tue, 17 Nov 2020 10:32:38 -0700<br>
From: Tim Wickberg <<a href="mailto:tim@schedmd.com" target="_blank">tim@schedmd.com</a>><br>
To: <a href="mailto:slurm-announce@schedmd.com" target="_blank">slurm-announce@schedmd.com</a>, <a href="mailto:slurm-users@schedmd.com" target="_blank">slurm-users@schedmd.com</a><br>
Subject: [slurm-users] Slurm version 20.11.0 is now available<br>
Message-ID: <<a href="mailto:312be1b3-bf71-cb3a-4a2e-2e56769318de@schedmd.com" target="_blank">312be1b3-bf71-cb3a-4a2e-2e56769318de@schedmd.com</a>><br>
Content-Type: text/plain; charset=utf-8; format=flowed<br>
<br>
After 9 months of development and testing we are pleased to announce the <br>
availability of Slurm version 20.11.0!<br>
<br>
Slurm 20.11 includes a number of new features including:<br>
<br>
- Overhaul of the job step management and launch code, alongside <br>
improved GPU task placement support.<br>
<br>
- A new "Interactive Step" mode of operation for salloc.<br>
<br>
- A new "scrontab" command that can be used to submit and manage <br>
periodically repeating jobs.<br>
<br>
- IPv6 support.<br>
<br>
- Changes to the reservation logic, with new options allowing users to <br>
delete reservations, allowing admins to skip the next occurance of a <br>
repeated reservation, and allowing for a job to be submitted and <br>
eligible to run within multiple reservations.<br>
<br>
- Dynamic Future Nodes - automatically associate a dynamically <br>
provisioned (or "cloud") node against a NodeName definition with <br>
matching hardware.<br>
<br>
- An experimental new RPC queuing mode for slurmctld to reduce thread <br>
contention on heavily loaded clusters.<br>
<br>
- SlurmDBD integration with the Slurm REST API.<br>
<br>
Please see the RELEASE_NOTES distributed alongside the source for <br>
further details.<br>
<br>
Thank you to all customers, partners, and community members who <br>
contributed to this release.<br>
<br>
As with past releases, the documentation available at <br>
<a href="https://slurm.schedmd.com" rel="noreferrer" target="_blank">https://slurm.schedmd.com</a> has been updated to the 20.11 release. Past <br>
versions are available in the archive. This release also marks the end <br>
of support for the 19.05 release. The 20.02 release will remain <br>
supported up until the 21.08 release next August, but will not see as <br>
frequent updates, and bug-fixes will be targeted for the 20.11 <br>
maintenance releases going forward.<br>
<br>
Slurm can be downloaded from <a href="https://www.schedmd.com/downloads.php" rel="noreferrer" target="_blank">https://www.schedmd.com/downloads.php</a> .<br>
<br>
- Tim<br>
<br>
-- <br>
Tim Wickberg<br>
Chief Technology Officer, SchedMD LLC<br>
Commercial Slurm Development and Support<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 3<br>
Date: Wed, 18 Nov 2020 10:37:00 +0530<br>
From: navin srivastava <<a href="mailto:navin.altair@gmail.com" target="_blank">navin.altair@gmail.com</a>><br>
To: Slurm User Community List <<a href="mailto:slurm-users@lists.schedmd.com" target="_blank">slurm-users@lists.schedmd.com</a>><br>
Subject: [slurm-users] Sreport Query<br>
Message-ID:<br>
        <<a href="mailto:CAK8-jZAnoJ0A_q6isCFWjcsAEpht%2BFDctEZPiqkpEcahx0M7Mg@mail.gmail.com" target="_blank">CAK8-jZAnoJ0A_q6isCFWjcsAEpht+FDctEZPiqkpEcahx0M7Mg@mail.gmail.com</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
Dear All,<br>
<br>
Good Day!<br>
<br>
i am seeing one strange behaviour in my environment.<br>
<br>
we have 2 clusters in our environment one acting as a database server and<br>
have pointed the 2nd cluster to the same database.<br>
<br>
------------------ ---------<br>
  hpc1  155.250.126.30         6817  8192         1<br>
                                                                  normal<br>
  hpc2  155.250.168.57         6817  8192         1<br>
                                                                  normal<br>
<br>
While generating the report I am able to generate for the local<br>
cluster(hpc1) without any issue  and it looks good. but from the second<br>
cluster data it always shows me 100% utilization from june onwards ,earlier<br>
data is fine.which is definitely wrong.<br>
<br>
sreport cluster utilization start=06/01/20 end=06/30/20 cluster=hpc2 -t<br>
percent | grep hpc2<br>
hpc2     100.00%    0.00%    0.00%    0.00%    0.00%     99.82%<br>
<br>
any suggestion what went wrong here. how to troubleshoot this issue.<br>
<br>
Regards<br>
Navin.<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://lists.schedmd.com/pipermail/slurm-users/attachments/20201118/41c08789/attachment-0001.htm" rel="noreferrer" target="_blank">http://lists.schedmd.com/pipermail/slurm-users/attachments/20201118/41c08789/attachment-0001.htm</a>><br>
<br>
------------------------------<br>
<br>
Message: 4<br>
Date: Wed, 18 Nov 2020 12:11:22 +0530<br>
From: navin srivastava <<a href="mailto:navin.altair@gmail.com" target="_blank">navin.altair@gmail.com</a>><br>
To: Slurm User Community List <<a href="mailto:slurm-users@lists.schedmd.com" target="_blank">slurm-users@lists.schedmd.com</a>><br>
Subject: Re: [slurm-users] Sreport Query<br>
Message-ID:<br>
        <CAK8-jZBH2wYrxTfh5w60=24JtHbvHL=<a href="mailto:Agq762c0yH1YZCQmP2Q@mail.gmail.com" target="_blank">Agq762c0yH1YZCQmP2Q@mail.gmail.com</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
is there a way to find the utilization per Node?<br>
<br>
Regards<br>
Navin.<br>
<br>
On Wed, Nov 18, 2020 at 10:37 AM navin srivastava <<a href="mailto:navin.altair@gmail.com" target="_blank">navin.altair@gmail.com</a>><br>
wrote:<br>
<br>
> Dear All,<br>
><br>
> Good Day!<br>
><br>
> i am seeing one strange behaviour in my environment.<br>
><br>
> we have 2 clusters in our environment one acting as a database server and<br>
> have pointed the 2nd cluster to the same database.<br>
><br>
> ------------------ ---------<br>
>   hpc1  155.250.126.30         6817  8192         1<br>
>                                                                     normal<br>
>   hpc2  155.250.168.57         6817  8192         1<br>
>                                                                     normal<br>
><br>
> While generating the report I am able to generate for the local<br>
> cluster(hpc1) without any issue  and it looks good. but from the second<br>
> cluster data it always shows me 100% utilization from june onwards ,earlier<br>
> data is fine.which is definitely wrong.<br>
><br>
> sreport cluster utilization start=06/01/20 end=06/30/20 cluster=hpc2 -t<br>
> percent | grep hpc2<br>
> hpc2     100.00%    0.00%    0.00%    0.00%    0.00%     99.82%<br>
><br>
> any suggestion what went wrong here. how to troubleshoot this issue.<br>
><br>
> Regards<br>
> Navin.<br>
><br>
><br>
><br>
><br>
><br>
><br>
><br>
><br>
><br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://lists.schedmd.com/pipermail/slurm-users/attachments/20201118/0ab04899/attachment-0001.htm" rel="noreferrer" target="_blank">http://lists.schedmd.com/pipermail/slurm-users/attachments/20201118/0ab04899/attachment-0001.htm</a>><br>
<br>
End of slurm-users Digest, Vol 37, Issue 33<br>
*******************************************<br>
</blockquote></div></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div>Veronica Chaul</div>+5411 3581-4041<div><img alt=""><br><div><img alt=""><br></div></div></div></div>