基于计算与通信重叠的稀疏矩阵-向量乘积及其在AMG中的应用
本文针对代数多重网格(algebraic multigrid,AMG)并行实现中的稀疏矩阵-向量乘,建立了稀疏矩阵新的分布和数据存储模式,提出了一类具有最小通信量以及隐藏通信的新稀疏矩阵-向量乘并行算法,并实现了基于K-循环迭代的求解阶段并行算法.针对现代多核处理器,结合细粒度的并行编程模型,实现了MPI+OpenMP混合编程并行算法.通过同hypre软件包测试比较,在深腾7000集群上求解三维Laplace方程并行规模达到512核心时,并行求解阶段运行时间较hypre(high performance preconditioners)软件包提高了56%,在元集群上提高了39%,验证了算法的有效性.
代数多重网格、预处理过程、数据存储格式、计算与通信重叠
36
国家自然科学基金重大研究计划No.91430214、国家重点基础研究发展计划973No.2011CB309702、国家高技术研究发展计划863No.2012AA01A309及数学工程与先进计算国家重点实验室开放基金No.2014A03资助.
2016-01-14(万方平台首次上网日期,不代表论文的发表时间)
197-214