我曾经用SLURM调度集群的工作,但现在我或多或少被迫改为基于SGE-集群,和我想要得到它挂起。 我工作SLURM系统上的事情涉及到运行,使用N输入文件的可执行文件,并以这种方式设置SLURM配置文件,
slurmConf.conf SLURM configuration file
0 /path/to/exec /path/to/input1
1 /path/to/exec /path/to/input2
2 /path/to/exec /path/to/input3
3 /path/to/exec /path/to/input4
4 /path/to/exec /path/to/input5
5 /path/to/exec /path/to/input6
6 /path/to/exec /path/to/input7
7 /path/to/exec /path/to/input8
8 /path/to/exec /path/to/input9
9 /path/to/exec /path/to/input10
而在SLURM我的工作提交脚本包含此线;
srun -n $SLURM_NNODES --multi-prog $slconf
$slconf refers to a path to that configuration file
这种设置工作,因为我想要的 - 在同一时间有10个节点运行10级不同的输入可执行文件。 现在,我只是转移到SGE系统,我希望做同样的事情,但我试着去阅读使用手册,发现没有很喜欢SLURM。 你能告诉我如何实现SGE系统上同样的事情,一些轻?
非常感谢你!