10.19678/j.issn.1000-3428.0062139
面向神威高性能多核处理器的并行编译优化方法
在神威高性能多核服务器上,自动并行化编译系统为识别和申明程序中的并行性,产生的OpenMP程序没有经过充分的优化,其采用简单的fork-join模型,存在大量的并行循环嵌套,导致运行效率低.为提升自动并行化编译系统产生的OpenMP程序的运行效率,提出一种并行域重构优化技术.并行域重构技术通过合并程序中的并行域和扩展嵌套循环中的并行域范围,减少OpenMP程序的并行域数目,降低线程组频繁创建和合并等控制开销,将简单fork-join模型的OpenMP程序转换为性能更为高效的单程序多数据模型的OpenMP程序.实验结果表明,在新一代神威高性能多核服务器SW1621平台上,并行域重构技术在NPB3.3-OMP测试集和SPEC OMP2012测试集上的运行效率分别提高了10.77%和7.94%的,可有效提升自动并行化编译系统OpenMP程序的执行效率.
神威高性能多核处理器、OpenMP编程、并行域重构、fork-join模型、单程序多数据模型
48
TP391(计算技术、计算机技术)
国家重点研发计划2016YFB0200503
2022-09-14(万方平台首次上网日期,不代表论文的发表时间)
共9页
130-138