摘要:
【目的】一个大规模科学计算任务往往包括多个计算作业或一个作业组,且多个计算作业之间有执行顺序、有依赖关系,用户需要等待上一个作业完成再提交下一个作业。为了减少用户的等待时间,急需一种新的作业提交方式,允许用户同时提交多个有依赖关系的作业。【方法】提出了面向高性能计算环境的智能任务编排架构,可以自动解析作业之间的依赖关系,智能编排作业提交顺序,监控作业状态,当被依赖作业完成后提交下一个作业。【结果】从实际应用效果来看,智能任务编排服务可以有效简化用户操作。【结论】具备较好的应用效果。
吴璨, 肖海力, 王小宁, 卢莎莎, 和荣. 面向高性能计算环境的智能任务编排架构研究[J]. 数据与计算发展前沿, 2025, 7(1): 99-107.
WU Can, XIAO Haili, WANG Xiaoning, LU Shasha, HE Rong. Research on Intelligent Task Orchestration for High Performance Computing Environment[J]. Frontiers of Data and Computing, 2025, 7(1): 99-107, https://cstr.cn/32002.14.jfdc.CN10-1649/TP.2025.01.007.