10.3969/j.issn.1007-130X.2021.04.003
基于Soft-NMS的候选框去冗余加速器设计
目标检测任务通常使用非极大值抑制算法(NMS)删除卷积神经网络输出的冗余候选框.Soft-NMS使用逐步衰减候选框得分值的方法代替Hard-NMS中直接删除大于预定义阈值候选框的方法,可以避免误删图像中重叠的目标候选框,提高目标检测任务的准确率.但是,频繁地改变候选框得分值使得Soft-NMS较Hard-NMS更为复杂,为了实现高准确率、低延时、低功耗的候选框去冗余效果,提出一种基于Soft-NMS的体系结构,利用对数函数优化复杂的浮点计算,细粒度流水和粗粒度并行组成2级优化结构进一步提升算法的吞吐率.在XILINX KU-115 FPGA开发板上对该体系结构进行了评估,评估结果表明,该体系结构的功耗为6.107W,处理992个候选框的延时为168.95μs,与CPU实现的Soft-NMS相比,该体系结构实现了36倍的性能提升,性能功耗比为CPU实现的264倍.
可重构计算、目标检测、非极大值抑制
43
TP391.9(计算技术、计算机技术)
国家科技重大专项2018ZX01028101
2021-05-27(万方平台首次上网日期,不代表论文的发表时间)
共8页
586-593