10.19678/j.issn.1000-3428.0053513
基于GPU的稀疏矩阵存储格式优化研究
稀疏矩阵存储格式中的稀疏矩阵向量乘(SpMV)计算效率低下,且分块行列(BRC)存储格式的计算结果缺少再现性和确定性.为此,提出一种改进的BRCP存储格式.采用不同的二维分块策略,根据矩阵各行非零元素分布的统计特性自适应调节分块参数,提高SpMV在GPU平台上的并行性,并设计基于快速分段求和算法的GPU内核函数,保证计算结果的确定性及其在不同GPU平台上的再现性.实验结果表明,BRCP存储格式具有较高的计算效率,相比BRC存储格式可减少并行环境中的SpMV计算误差,并提高PageRank排序的准确率.
稀疏矩阵向量乘、计算统一设备架构、图形处理器、存储格式、浮点运算
45
TP312(计算技术、计算机技术)
国家自然科学基金61672298,61873326,61373136
2019-10-24(万方平台首次上网日期,不代表论文的发表时间)
共10页
23-31,39