10.3969/j.issn.1000-3428.2016.03.009
数字信号变换函数在多簇VLIW DSP上的优化
针对BWDSP100体系结构特点,基于循环展开、指令调度以及软件流水等并行优化技术,结合多簇超长指令架构的特点,通过使用超算硬件指令、零开销循环、指令重新编排与并行等方法对BWDSP100数字信号处理函数库中的函数实施并行化,并基于库中原有的顺序版本实现并行优化版本.实验结果表明,在4宏并行化模式下,所有函数加速比达到9以上,90%的函数加速比超过10,平均加速比为11.12.
超长指令字、单指令流多数据流、数字信号处理器、循环展开、并行化、多簇
42
TP391(计算技术、计算机技术)
高等学校学科创新引智计划基金资助项目B07033;安徽省自然科学基金资助项目“基于GPU集群的深度神经网络并行部署和优化策略研究”1408085MKL06
2016-06-15(万方平台首次上网日期,不代表论文的发表时间)
共6页
47-52