10.3969/j.issn.1673-629X.2018.04.014
基于OpenACC的高性能计算并行优化研究与应用
针对GPU加速时存在的编码复杂性、移植性差导致开发维护效率低下的缺陷,利用基于OpenACC指导命令的加速技术对传统的串行代码进行改写,从而达到提高开发效率、简化代码的目的.以GRAPES全球模式长波辐射过程为研究对象,首先通过编译选项对程序性能进行初步优化,再根据其数据依赖和访存特性,对数据和循环结构进行预处理并添加OpenACC指导命令实现循环级并行.实验结果表明,长波辐射过程并行计算结果正确,在不改变原有代码结构的基础上即可获得4~6倍的加速比,优化性能可比拟相同计算能力的Intel集群,虽然较GPU加速仍有差距,但大大增强了代码的可读性和可移植性,且随着编译器和硬件技术的发展,OpenACC有着广阔的发展空间.
神威·太湖之光、OpenACC、GRAPES模式、长波辐射过程
28
TP301(计算技术、计算机技术)
国家重点研发计划项目2016YFA0602102;公益性行业专项气象科研专项GYHY201306062;中国气象局局校合作项目
2018-05-11(万方平台首次上网日期,不代表论文的发表时间)
共6页
65-70