<div dir="ltr"><div>Hi All,</div><div>i am trying to hold the job from Scontol but not able to hold the job.</div><div>i am not able to understand..can any one please explain the concept of Hold and Release, Suspend and Resume.</div><br clear="all"><div>Please find the below steps which i have tried.</div><div><br></div><div>[root@master ~]# cat test.sh<br>#!/bin/bash<br><br>#SBATCH -N 1<br>#SBATCH -n 1<br>#SBATCH -p hpc<br>#SBATCH -t 01:00:00<br>#SBATCH -J testjob<br>#SBATCH -o testjob.o%j<br>#SBATCH -e testjob.e%j<br><br>cd $SLURM_SUBMIT_DIR<br>/bin/hostname<br>date<br>sleep 120<br><br>[root@master ~]# sbatch test.sh<br>Submitted batch job 28<br>[root@master ~]# sbatch test.sh<br>Submitted batch job 29<br>[root@master ~]# sbatch test.sh<br>Submitted batch job 30<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                30       hpc  testjob     root PD       0:00      1 (Resources)<br>                28       hpc  testjob     root  R       0:06      1 master<br>                29       hpc  testjob     root  R       0:05      1 master<br>[root@master ~]# sinfo -Nl<br>Sun May 23 11:16:55 2021<br>NODELIST   NODES PARTITION       STATE CPUS    S:C:T MEMORY TMP_DISK WEIGHT AVAIL_FE REASON<br>master         1      hpc*   allocated 2       2:1:1   1024        0      1   (null) none<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                30       hpc  testjob     root PD       0:00      1 (Resources)<br>                28       hpc  testjob     root  R       0:39      1 master<br>                29       hpc  testjob     root  R       0:38      1 master<br>[root@master ~]# scontrol hold 28<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                30       hpc  testjob     root PD       0:00      1 (Resources)<br>                29       hpc  testjob     root  R       1:04      1 master<br>                28       hpc  testjob     root  R       1:05      1 master<br>[root@master ~]# scontrol hold 28<br>[root@master ~]# scontrol hold 28<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                30       hpc  testjob     root PD       0:00      1 (Resources)<br>                29       hpc  testjob     root  R       1:14      1 master<br>                28       hpc  testjob     root  R       1:15      1 master<br>[root@master ~]# scontrol suspend 28<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                29       hpc  testjob     root  R       1:38      1 master<br>                30       hpc  testjob     root  R       0:01      1 master<br>                28       hpc  testjob     root  S       1:37      1 master<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                29       hpc  testjob     root  R       1:59      1 master<br>                30       hpc  testjob     root  R       0:22      1 master<br>                28       hpc  testjob     root  S       1:37      1 master<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                30       hpc  testjob     root  R       0:41      1 master<br>                28       hpc  testjob     root  S       1:37      1 master<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                30       hpc  testjob     root  R       0:55      1 master<br>                28       hpc  testjob     root  S       1:37      1 master<br>[root@master ~]# scontrol release 28<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                30       hpc  testjob     root  R       1:20      1 master<br>                28       hpc  testjob     root  S       1:37      1 master<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                30       hpc  testjob     root  R       1:22      1 master<br>                28       hpc  testjob     root  S       1:37      1 master<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                30       hpc  testjob     root  R       1:23      1 master<br>                28       hpc  testjob     root  S       1:37      1 master<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                30       hpc  testjob     root  R       1:25      1 master<br>                28       hpc  testjob     root  S       1:37      1 master<br>[root@master ~]# scontrol resume 28<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                30       hpc  testjob     root  R       1:40      1 master<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>                30       hpc  testjob     root  R       2:00      1 master<br>[root@master ~]# squeue<br>             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)<br>[root@master ~]#<br></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div dir="ltr"><div dir="ltr"><b style="background-color:rgb(255,255,255)"><font color="#000000" face="times new roman, serif">Regards</font></b></div><div dir="ltr"><b style="font-size:12.8px"><font color="#000000" face="times new roman, serif">Zain<br></font></b></div></div></div></div></div>