10.3969/j.issn.1000-1220.2012.05.012
一种用于通用处理器结构优化的矩阵乘法性能模型
矩阵乘法作为高性能计算中的关键组成部分,是一种具有计算和访存密集特点的典型应用,因此优化矩阵乘法的性能对通用处理器是非常重要的.为了提高矩阵乘法的性能,本文提出了一种性能模型,用于预测通用处理器上矩阵乘法的执行时间.该模型反映了矩阵乘法执行时间与通用处理器的运算部件、访存带宽、寄存器个数等结构参数之间的关系,可以指导处理器结构的优化来平衡计算和访存能力、提高执行速度.基于该模型本文给出了在一个优化的通用处理器结构中,寄存器个数和访存带宽应满足的理论下界.本文在Godson-3B处理器平台上对该性能模型进行了验证,实验结果表明矩阵乘法执行时间的预测精确度达到95%以上.基于该模型,本文还提出了一种对Godson-3B结构进行优化的方法,使矩阵乘法的执行时间减少了50%左右.
矩阵乘法、性能模型、通用处理器、结构优化
33
TP301(计算技术、计算机技术)
国家科技重大专项项目2009ZX01028-002-003,2009ZX01029-001-003
2012-09-29(万方平台首次上网日期,不代表论文的发表时间)
共6页
981-986