10.3778/j.issn.1673-9418.1412060
GPU集群加速近似逆预条件CG并行求解器
针对GPU集群系统,研究了分解近似逆(approximate inverse,AINV)和对称逐次超松弛-近似逆(sym-metric successive over relaxation approximate inverse,SSOR-AI)两类近似逆预条件的并行算法。采用多级k-路图划分方法,通过子图的内点和边界点识别方法以及稀疏矩阵的置换技术,提出了将稀疏矩阵转换为分块箭形矩阵的并行方法。基于所形成的分块箭形矩阵,结合块内稀疏矩阵近似逆串行、块间并行的策略给出了近似逆预条件的并行方法,实现了AINV和SSOR-AI并行算法,解决了AINV预条件难以并行的问题。基于CPU与GPU协同计算、主机端页锁定内存和设备端计算与通信重叠的优化技术,实现了并行近似逆预条件与共轭梯度(conjugate gradient,CG)算法相结合的线性方程组混合并行求解器。数值实验表明,所提方法对AINV和SSOR-AI两类近似逆预条件,在多GPU上获得了很好的可扩展性和加速效果。
近似逆、预条件、迭代法、异构并行计算、GPU集群
TP338.6(计算技术、计算机技术)
The National Basic Research Program of China under Grant No.2011CB309702国家重点基础研究发展计划973计划;the Open Project of State Key Laboratory of Mathematical Engineering and Advanced Computing under Grant No.2014A03
2015-09-21(万方平台首次上网日期,不代表论文的发表时间)
共9页
1084-1092