10.3969/j.issn.1000-3428.2008.07.029
GOTOBLAS一般矩阵乘法高效实现机制的研究
对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析.结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度.对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库.证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性.
GOTOBLAS库、一般矩阵乘法、存储层次、分块算法、计算模型
34
TP311(计算技术、计算机技术)
国家自然科学基金60303020;国家自然科学基金60533020;国家重点基础研究发展计划973计划2005CB321702;国家高技术研究发展计划863计划2006AA01A102;2006AA01A125
2008-06-23(万方平台首次上网日期,不代表论文的发表时间)
共4页
84-86,103