<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
  </head>
  <body text="#000000" bgcolor="#FFFFFF">
    <p>This is the idea behind XDMod's SUPReMM.  It does generate a ton
      of data though, so it does not scale to very active systems (i.e.
      churning over tens of thousands of jobs).</p>
    <p><a class="moz-txt-link-freetext" href="https://github.com/ubccr/xdmod-supremm">https://github.com/ubccr/xdmod-supremm</a></p>
    <p>-Paul Edmon-<br>
    </p>
    <br>
    <div class="moz-cite-prefix">On 12/9/2018 8:39 AM, Aravindh
      Sampathkumar wrote:<br>
    </div>
    <blockquote type="cite"
cite="mid:1544362793.1317966.1603634864.6DC1496A@webmail.messagingengine.com">
      <meta http-equiv="content-type" content="text/html; charset=utf-8">
      <title></title>
      <style type="text/css">p.MsoNormal,p.MsoNoSpacing{margin:0}</style>
      <div style="font-size:16px;">Hi All.<br>
      </div>
      <div style="font-size:16px;"><br>
      </div>
      <div style="font-size:16px;">I was wondering if anybody has
        thought of or hacked around a way to record CPU and memory
        consumption of a job during its entire duration and give a
        summary of the usage pattern within that job? <br>
      </div>
      <div style="font-size:16px;">Not the MaxRSS and CPU Time that
        already gets reported for every job. <br>
      </div>
      <div style="font-size:16px;"><br>
      </div>
      <div style="font-size:16px;">I'm thinking more like a chart of CPU
        utilisation, memory usage, and disk usage on a per second basis
        or something like that. <br>
      </div>
      <div style="font-size:16px;"><br>
      </div>
      <div style="font-size:16px;">Asking because some of my users have
        no clue about the resource consumption of their jobs, and just
        blindly ask for way more resources as "safe" option. It would be
        a nice way for users to know simple things like - they asked for
        8 cores, but their job ran on just 1 core the entire time
        because a library they used is single core limited. <br>
      </div>
      <div style="font-size:16px;">We use Cgroups for process accounting
        and limiting job's cpu and memory usage. We also use QoS for
        limiting resource reservations at user level. <br>
      </div>
      <div style="font-size:16px;"><br>
      </div>
      <div id="sig56753105">
        <div class="signature">--<br>
        </div>
        <div class="signature">  Aravindh Sampathkumar<br>
        </div>
        <div class="signature">  <a class="moz-txt-link-abbreviated" href="mailto:aravindh@fastmail.com">aravindh@fastmail.com</a><br>
        </div>
        <div class="signature"><br>
        </div>
      </div>
      <div style="font-size:16px;"><br>
      </div>
    </blockquote>
    <br>
  </body>
</html>