10.19678/j.issn.1000-3428.0060080
GRAPES动力框架中大规模稀疏线性系统并行求解及优化
赫姆霍兹方程求解是GRAPES数值天气预报系统动力框架中的核心部分,可转换为大规模稀疏线性系统的求解问题,但受限于硬件资源和数据规模,其求解效率成为限制系统计算性能提升的瓶颈.分别通过MPI、MPI+OpenMP、CUDA三种并行方式实现求解大规模稀疏线性方程组的广义共轭余差法,并利用不完全分解LU预处理子(ILU)优化系数矩阵的条件数,加快迭代法收敛.在CPU并行方案中,MPI负责进程间粗粒度并行和通信,OpenMP结合共享内存实现进程内部的细粒度并行,而在GPU并行方案中,CUDA模型采用数据传输、访存合并及共享存储器方面的优化措施.实验结果表明,通过预处理优化减少迭代次数对计算性能提升明显,MPI+OpenMP混合并行优化较MPI并行优化性能提高约35%,CUDA并行优化较MPI+OpenMP混合并行优化性能提高约50%,优化性能最佳.
稀疏线性系统;广义共轭余差法;信息传递接口;OpenMP编程;统一计算架构
48
TP311.1(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;青海省科技计划;教育部春晖计划
2022-01-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
149-154,162