10.16208/j.issn1000-7024.2022.02.010
面向人脸检测MTCNN网络的加速硬件设计
为加快深度学习人脸检测算法MTCNN(multi-task convolution neural network)的推理速度,满足许多应用场合检测的实时性的要求,基于Xilinx FPGA ZCU102开发板设计针对MTCNN专门优化的卷积和全连接加速硬件.该加速硬件不仅适用于MTCNN网络,其它神经网络推理算法也可以使用.针对算法特点,硬件采用小而多的计算核心,支持动态分块、图像间混合计算、片上多核共享RAM等完全自主开发的软硬件协同技术.在100 MHZ的频率下对MTCNN应用在加速器上的加速效果进行测试并和ARM程序进行对比,可以得到加速器相对于ARM O2速度加快了6倍多.
多任务卷积神经网络;卷积;全连接;加速硬件;人脸检测;软硬件协同
43
TP332(计算技术、计算机技术)
国家重点研发计划2016YFA0201804
2022-03-03(万方平台首次上网日期,不代表论文的发表时间)
共6页
370-375