GPU矩阵乘法和FFT算法的性能优化
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3969/j.issn.1004-373X.2013.04.023

GPU矩阵乘法和FFT算法的性能优化

引用
当前GPU的体系结构为高性能计算提供了良好的可编程性.为了得到众核GPU高性能程序设计的一般方法,探索GPU程序性能优化技术,对在GPU上进行高性能程序设计的经验进行了总结.通过基准测试,得到GPU性能指标,对GPU程序设计进行指导.使用CUDA对单精度矩阵乘法和FFT进行性能优化,前一个算法是计算密集型任务,后一个算法是带宽密集型任务.在NVIDIA GeForce GTX280 GPU上,矩阵乘法算法达到393 Gflop/s的峰值速度,比CUBLAS 2.0数学库提高了5%;对于一些维度的FFT计算也取得了较好的性能.

GPU程序设计、矩阵乘法、快速傅里叶变换、性能优化技术

36

TN911-34;TP312

国家"863"高技术研究发展计划项目基金2012AA010902;国家自然科学基金资助项目61240045,10571178

2013-03-28(万方平台首次上网日期,不代表论文的发表时间)

共5页

80-84

相关文献
评论
暂无封面信息
查看本期封面目录

现代电子技术

1004-373X

61-1224/TN

36

2013,36(4)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn