基于Intel Xeon Phi的稀疏矩阵向量乘性能优化
:稀疏矩阵向量乘(SpMV)是线性求解系统等科学计算中重要的计算核心.鉴于传统的稀疏矩阵向量乘算法在IntelXeon Phi众核集成架构上存在SIMD利用率低,不规则访存开销高及负载不均衡的问题,难以发挥其运算能力.本文针对IntelXeon Phi的体系结构特点,提出了一种通用的分块压缩存储表示的稀疏矩阵向量乘并行算法:(1)在ELLPACK存储格式基础上按列分块及压缩矩阵,增加非零元的密度,提高SIMD利用率;(2)通过精心的数据重排,保留矩阵非零元本身的局部性,从而提高数据重用率,降低访存开销;(3)将矩阵压缩后划分成近似等大的矩阵块并静态等量分配到不同核上计算,使各核负载均衡.实验结果表明,与Intel Xeon Phi上已有的MKL数学库中的CSR算法相比,本算法获得了更高的计算访存比,性能比MKL的CSR算法平均快2.05倍.
稀疏矩阵向量乘、数据布局重组、Intel Xeon Phi、分块压缩存储
37
TP311(计算技术、计算机技术)
国家“八六三”高技术研究发展计划项目2012AA010901,2012AA010902
2016-10-25(万方平台首次上网日期,不代表论文的发表时间)
共6页
818-823