DOI：10.3969/j.issn.1007-130X.2013.11.006

大点数一维FFT的GPU设计实现

引用

摘要：

鉴于GPU强大的计算性能以及先进的并行处理器架构,主要研究一种将FFT的并行算法映射到CUDA模型的并行设计方法.该设计方法遵循如减少内核函数中的全局存储器访问、全局存储器合并访问、高效利用共享存储器、高密集度计算等GPU平台下主要的设计准则进行优化设计,并在基于NVIDIAFermi处理架构的Tesla C2075 GPU平台上进行了大点数一维FFT设计实现.实验结果表明了该方法的可行性及高效性,在256K点范围内性能优于CUFFT库,加速比最高达到CUFFT 4.0库的2.1倍.

关键词：CUDA 4.0、快速傅里叶变换、GPU、高性能计算

所属期刊栏目：35

分类号：TP311(计算技术、计算机技术)

在线出版日期：2013-12-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：34-41

英文信息展示

期刊专题