启动工作

调度软件粘可用于发射很多工作在玛蒂尔达HPC集群。

srun与某人命令是专为交互使用,监控输出。

批处理作业可以启动使用sbatch命令或粘作业提交很多脚本

如果你不熟悉粘Workload Manager很多,看看粘文档在很多SchedMD

主要粘命令很多

sbatch

sbatch——提交作业脚本。sbatch命令提交批处理粘队列管理器很多工作。这些脚本通常包含一个或多个srun命令队列进行处理工作。

sbatch samplejobscript。sh(需要16芯,蔓延到4个节点,并使用4 cpu)

# ! / bin / bash##示例批处理脚本###指定有多少个节点(物理服务器)使用。= 4 # SBATCH——节点#使用- n或——ntasks指定有多少任务运行# SBATCH——ntasks = 4#指定要使用多少CPU核/任务# SBATCH——cpus-per-task = 4#指定一个时间限制的工作运行# = 00:10:00 SBATCH——时间#标准输出和错误日志# = job_output_ % j.log SBATCH——输出#明确环境从任何先前加载模块模块清洗> / dev / null 2 > & 1#加载模块适合这份工作的环境模块加载gcc slurm#最后运行工作srun主机名srun睡眠10

srun

srun——分配计算节点上运行一个命令(年代)。srun命令用于提交作业的执行,或启动步骤的工作。全面的选项,可以传递到srun命令,。

scancel

scancel——删除一个工作。scancel命令将终止等待和运行工作步骤。您还可以使用它来发送一个unix信号相关联的所有进程运行的工作或工作步骤。

scancel < jobid >

squeue

squeue——显示工作状态。squeue命令将报告运行的状态,等待工作。

squeue - u用户名

sinfo

sinfo——显示节点的状态和分区(队列)。sinfo命令将报告可用分区和节点的状态

smap

smap,展示工作,分区在图形化网络拓扑和节点。smap命令sinfo命令类似,除了它显示的所有信息中,ncurses终端。

scontrol

scontrol——修改工作或显示信息的各个方面集群scontrol命令用于调整粘的东西很多。你很可能用它来修改你的工作当他们在队列中,节点数量或数量的任务/ cpu。也可以用于显示信息工作,分区结构和节点。


CategoryHPC