SGE【Sun Grid Engine 或 Oracle Gird Engine】
简介:
是一套开源的分布式资源管理软件,用来统一管理和利用所有(愿意被管理的)电脑上的资源,使得这些电脑(集群)使用起来就像一台电脑一样
好处:
可以随意扩展总的计算资源(买更多的电脑加入集群),并且管理上就像使用一台电脑一样方便
常用命令
说明 | 查询命令 |
---|---|
【查看】集群信息 | qhost |
【查看】所有任务 | qstat -f /qstat |
【查看】按任务id | qstat -j jobId |
【查看】按用户 | qstat -u user |
【删除】任务 | qdel -j jobId |
状态 | 说明 |
---|---|
qw | 表示等待状态 |
Eqw | 投递任务出错 |
r | 表示任务正在运行 |
dr | 节点挂了之后,删除任务就会出现这个状态,只有节点重启之后,任务才会消失 |