<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div class=""><span style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); background-color: rgb(255, 255, 255);" class="">I stumbled across </span><span style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); background-color: rgb(255, 255, 255);" class="">CRIU</span> (<span style="caret-color: rgb(34, 34, 34); color: rgb(34, 34, 34); background-color: rgb(255, 255, 255);" class="">Checkpoint/Restore In Userspace) </span><a href="https://criu.org/Main_Page" class="">https://criu.org/Main_Page</a> a couple of weeks ago.  I have not utilized it yet it; it's on my ToDo list. They claim that it’s packaged with most distress;  I checked RHEL/CentOS and it was there. Be careful of package/kernel versions; i.e  a good reason to go with the version included in your distro.  BLCR was last updated January 2013; back in the day, it worked well enough for simpler apps;  complicated MPI apps was less so.</div><div class=""><br class=""><div class="">   - geo</div><div class=""><br class=""><br class="">

</div>
<div><br class=""><blockquote type="cite" class=""><div class="">On Oct 4, 2019, at 11:17 PM, Renfro, Michael <<a href="mailto:Renfro@tntech.edu" class="">Renfro@tntech.edu</a>> wrote:</div><br class="Apple-interchange-newline"><div class="">

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" class="">

<div dir="auto" class=""><div style="font-family: Arial, Helvetica, sans-serif;font-size: 12px;background-color: #ffece5;color: #82270d;border-left: .25rem solid #df3603;padding: .5rem;position: relative;text-align: left;line-height: 1.25;" class="">This message was sent from a non-IU address. Please exercise caution when clicking links or opening attachments from external sources.</div><br class="">
DMTCP might be an option? Pretty sure there are RPMs for it in RHEL/CentOS 7. Don’t recall it being any trouble to install.
<div class=""><br class="">
</div>
<div class=""><a href="http://dmtcp.sourceforge.net/" class="">http://dmtcp.sourceforge.net/</a><br class="">
<div dir="ltr" class=""><br class="">
On Oct 4, 2019, at 9:47 PM, Eliot Moss <<a href="mailto:moss@cs.umass.edu" class="">moss@cs.umass.edu</a>> wrote:<br class="">
<br class="">
</div>
<blockquote type="cite" class="">
<div dir="ltr" class=""><span class="">Dear slurm users --</span><br class="">
<span class=""></span><br class="">
<span class="">I'm new to slurm (somewhat experienced with Grid Engine, though that's</span><br class="">
<span class="">not relevant to this post).  I have access to two slurm based clusters,</span><br class="">
<span class="">and have an application that (a) can be _very_long running (more than</span><br class="">
<span class="">8 weeks for one execution, though the compute and I/O demands of one</span><br class="">
<span class="">such job are not huge by modern standards) and that (b) is not at all</span><br class="">
<span class="">practical to convert to do its own checkpoints.  (I am running traces</span><br class="">
<span class="">from the valgrind program of every memory reference and branch made</span><br class="">
<span class="">when running individual SPEC benchmarks; this is then piped to 8</span><br class="">
<span class="">downstream analyzers, mostly Java programs.)</span><br class="">
<span class=""></span><br class="">
<span class="">From what I have read, BLCR would meet my needs for checkpointing,</span><br class="">
<span class="">but the admins of both clusters are reluctant to pursue BLCR support.</span><br class="">
<span class="">I myself am wondering whether it is still working, etc., and what it</span><br class="">
<span class="">means that built-in support has been removed, etc.  Can someone offer</span><br class="">
<span class="">a brief explanation of the status and recent history of BLCR w.r.t.</span><br class="">
<span class="">slurm?</span><br class="">
<span class=""></span><br class="">
<span class="">Many thanks!   Eliot Moss, UMass Amherst Computer Science</span><br class="">
<span class=""></span><br class="">
</div>
</blockquote>
</div>
</div>

</div></blockquote></div><br class=""></div></body></html>