面向国产异构众核架构的CFD非结构网格计算并行优化方法
神威太湖之光在2016-2018年度全球超算top500榜单中排名第一,峰值性能为125.4 PFlops,其计算能力主要归功于国产SW26010众核处理器.由于CFD非结构网格计算存在拓扑关系复杂、离散访存问题严重、存在强相关的线化方程求解等问题,导致CFD非结构网格计算一直是国产众核超级计算机移植与优化的难题.为充分发挥国产异构众核架构的计算效能,首先,提出了 一种数据重构模型,提高了数据的局部性和可并行性,使得数据结构更加适应众核架构的特点;然后,针对非结构网格数据存放的无序性导致的离散访存问题,提出了一种基于信息关系预存的离散访存优化方法,将离散访存转化为连续访存;最后,对于存在强相关的线化方程求解问题,引入了从核阵列流水线并行的思想,实现了众核并行.优化后CFD非结构网格计算的整体性能相比原始版本提升了 4.19倍,相比通用CPU提升了 1.2倍,并扩展到62.4万计算核心的并行规模,能保持64.5%的并行效率.
计算流体力学、异构众核、神威超级计算机、非结构网格、并行计算
49
TP311(计算技术、计算机技术)
国家重点研发计划;国家科技重大专项
2022-06-24(万方平台首次上网日期,不代表论文的发表时间)
共9页
99-107