10.3969/j.issn.1002-137X.2012.12.068
龙芯3A上三个自适应FFT包的对比与分析
FFT算法在计算机科学中具有广泛的应用,自适应FFT软件包以其良好的可移植性而备受研究人员和用户的青睐,龙芯3A是中科院计算所自主研发的四核CPU,采用RISC架构,兼容MIPS指令.主要对FFTW,UHFFT,SPIRAL这3类FFT自适应软件包进行研究.首先从搜索框架和代码产生器两方面总结了FFTW和UHFFT的异同,接着阐述了SPIRAL自动产生优化代码的三层架构实现原理,之后在国产CPU龙芯3A上对这3个软件包进行了性能测试,并结合龙芯的体系结构特点对结果作了分析对比.在最后总结了目前自适应FFT软件包的一般方法,为下一步开发自适应FFT软件包提供了思路.
FFTW、UHFFT、SPIRAL、Loongson 3A、FFT
39
TP319(计算技术、计算机技术)
国家自然科学基金61133005;国家高技术研究发展项目8632009AA01A129,2009AA01A134;国家重大专项核高基项目2009ZX01036-001-002
2013-01-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
281-285