10.3969/j.issn.1000-565X.2015.11.006
共轭梯度法在GPU及Xeon Phi下的并行优化及比较
为了充分利用多核处理器的强大计算能力并满足具有高并行度应用的需求,提出一种基于大规模稀疏矩阵特征问题求解的并行共轭梯度算法.对图形处理器(GPU)上的计算,有效利用GPU多层次的存储器体系,采用线程与矩阵映射、数据合并访问、数据复用等优化手段,并通过高效的线程调度来隐藏全局存储器的高延迟访问;对Xeon Phi处理器上的计算,有效利用Xeon Phi的高并行度计算对数据通信/传递、减少数据依赖、向量化、异步计算等进行优化,并通过高效的线程调度来隐藏全局存储器的高延迟访问.文中还通过实验验证了算法的可行性和正确性,并对比了不同方式下的运行效率,发现共轭梯度法在GPU下比在Xeon Phi下的加速效果更好.
共轭梯度法、图形处理器、Xeon Phi、并行优化、稀疏矩阵向量乘
43
TP391.9(计算技术、计算机技术)
广东省公益研究与能力建设专项2014A040401018;广东省促进科技服务业发展计划项目2013B040404009;广东省新媒体与品牌传播创新应用重点实验室资助项目2013WSYS0002
2016-04-07(万方平台首次上网日期,不代表论文的发表时间)
共13页
35-46,53