10.16208/j.issn1000-7024.2023.03.014
面向人车识别的目标检测系统实现
为将参数量巨大的神经网络模型部署到资源有限、功耗要求极高的嵌入式端,以较好的速度运行,研究8 bit整型量化算法和神经网络前向推理过程在FPGA上的具体实现.通过8 bit整型量化,将模型的参数量从22.5 M缩减至5.7 M,模型参数量缩小近4倍,提高神经网络在嵌入式端部署的可行性.基于FPGA并行处理的特点,设计精简指令,优化卷积运算中输入输出和计算过程的并行处理.在实验中可以在较低功耗下加速神经网络前向推理过程.
轻量化神经网络、深度学习、FPGA加速、人车识别、自动驾驶
44
TP389.1(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;天津市自然科学基金;天津市自然科学基金;天津市教委科研计划基金项目;天津市教委科研计划基金项目
2023-05-08(万方平台首次上网日期,不代表论文的发表时间)
共7页
739-745