准对角矩阵与向量相乘在CPU+GPU异构集群上的实现与优化
稀疏矩阵与向量相乘(SpMV)是科学计算和工程应用中一个重要问题,而且非常适宜进行并行计算,目前在GPU对SpMV的实现和优化是一个研究热点.针对准对角矩阵存在的一些不规则性,采用CSR+ DLA混合存储格式来进行SpMV计算,能够提高压缩的效果.为了发挥CPU多核的并行计算能力,采用一种CPU+ GPU混合计算模式,这样可以把混合存储格式不同格式的数据分割到CPU和GPU上,从而提高了资源的利用效能.本文另外还在分析CPU+ GPU异构计算模式的特征基础上,提出一些优化策略,能够改进准对角矩阵与向量相乘在异构计算环境中的计算性能.
图形处理芯片、稀疏矩阵、稀疏矩阵与向量相乘、异构计算
36
TP311(计算技术、计算机技术)
国家自然科学基金重点项目61432005;国家自然基金项目61472124;湖南省教育厅科学研究重点项目13A011
2016-09-18(万方平台首次上网日期,不代表论文的发表时间)
共6页
1659-1664