并行作业启动及其可扩展性分析
随着高性能计算机系统与并行应用规模的不断增加,大规模并行作业的启动时间不能再被忽略不计.已有的研究给出了在Tianhe-1A系统上加载MPI作业的性能结果.通过分析作业启动在控制消息传递、文件访问、MPI环境初始化等各阶段的时间开销,发现对于大规模MPI作业而言,环境初始化时间是作业启动的主要开销.基于此发现进行了一些优化,减少MPI环境初始化时交换的数据量,并避免不必要的数据传输开销.显著地提高了并行作业启动的性能,进而提出了一种层次式的可扩展进程管理结构,以进一步增强作业启动的可扩展性.与其他主流MPI实现的进程管理机制的作业启动时间进行了比较.
高性能计算、并行作业启动、进程管理、MPI、可扩展性
50
TP316(计算技术、计算机技术)
国家自然科学基金项目61120106005;国家"八六三"高技术研究发展计划基金项目2012AA01A301
2013-09-16(万方平台首次上网日期,不代表论文的发表时间)
共7页
1755-1761