10.3969/j.issn.1673-629X.2021.11.017
HXDSP上双精度矩阵向量乘运算的实现与优化
目前HXDSP1042编译器的编程模型已经可以支持以字节为单位的寻址模式以及64位数据的存取与运算,这对于提高浮点数据运算的精度具有重要的意义.矩阵类算法是雷达信号处理的常用运算,在自适应波束形成、方向估计中矩阵运算占有相当大的比重,现在很多DSP处理器并不能自动地充分利用自身所拥有的硬件架构,如何让编译器高效地处理矩阵类的运算变得尤为重要.HXDSP1042是一款针对数字信号处理及嵌入式应用的处理器,如何在HXDSP1042指令框架下,针对该芯片的硬件特点展开矩阵类运算的设计,是芯片走向高性能应用的重要一步.文中结合多簇VLIW指令架构的特点,基于循环展开、指令调度以及软件流水等并行优化技术,充分利用芯片内部硬件资源,对HXDSP1042芯片中的双精度浮点矩阵乘以向量运算函数实施并行优化.实验结果表明,相对于优化前的串行算法结构来说,并行优化后的函数加速比达到了11以上.
多簇;单指令流多数据流;64位数据运算;软件流水;数字信号处理器
31
TP301(计算技术、计算机技术)
国家科技重大专项项目2012ZX01034001-001
2021-11-23(万方平台首次上网日期,不代表论文的发表时间)
共7页
101-107