面向车规级芯片的对象检测模型优化方法
卷积神经网络复杂的网络结构使得模型计算复杂度高,限制了其在自动驾驶等实际终端场景中的应用.针对终端场景下的计算资源受限的问题,本文从轻量化深度模型设计和车规级芯片模型部署验证两方面进行研究.针对深度模型计算效率和检测精度的矛盾,本文设计了基于中心卷积的轻量化对象检测模型,实现功耗低且精度高的模型性能.进一步,本文基于量化感知训练的模型加速部署方法在车规级芯片上开展了系统级部署验证,在车规级芯片tda4上成功实现了高效的对象检测模型,在自动驾驶场景中取得了良好的性能.
人工智能;计算机视觉;对象检测;终端设备;车规级芯片;卷积神经网络;模型加速;模型量化
16
TP18(自动化基础理论)
国家自然科学基金项目;中国博士后科学基金创新人才计划项目
2021-11-25(万方平台首次上网日期,不代表论文的发表时间)
共9页
899-907