10.19678/j.issn.1000-3428.0049718
基于GPU的并行Cholesky分解及其应用
在OpenCL并行计算框架的clMAGMA库中, Cholesky分解算法采用大尺寸分块并行方法, 不能充分利用GPU的高速局部存储器, 且在计算过程中存在多次GPU-CPU间的数据传递.为此, 提出采用小尺寸分块并行方法, 充分利用GPU中的高速局部存储器, 使矩阵子块的逆矩阵得到复用, 完成对称正定矩阵的高效Cholesky分解, 并且其能够应用于三维视觉光束平差问题中的大型正定矩阵的分解.实验结果表明, 该方法的Cholesky分解速度比clMAGMA提升50%以上, 针对光束平差问题, 比Ceres Solver中使用的Eigen库速度提升约38倍.
正定系统、Cholesky分解、并行计算、OpenCL框架、光束平差
45
TP361(计算技术、计算机技术)
浙江省自然科学基金重点项目 LZ16E050002
2019-05-31(万方平台首次上网日期,不代表论文的发表时间)
共6页
284-289