10.3969/j.issn.1003-3254.2011.01.038
GPU上的矩阵乘法的设计与实现
矩阵乘法是科学计算中最基本的操作,高效实现矩阵乘法可以加速许多应用.本文使用NVIDIA的CUDA在GPU上实现了一个高效的矩阵乘法.测试结果表明,在Geforce GTX 260上,本文提出的矩阵乘法的速度是理论峰值的97%,跟CUBLAS库中的矩阵乘法相当.
矩阵乘法、GPU、CUDA
20
TP3;O15
国家自然科学基金60833004;国家高技术研究发展计划8632008AA010902
2011-04-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
178-181,149