基于FPGA与退化YOLO的手机镜片缺陷检测系统
针对镜片缺陷检测采用图像处理法和神经网络法存在时延高、功耗高和检测缺陷类别较少等问题,设计了一种基于FPGA与退化YOLO的软硬协同检测系统.系统中使用卷积层代替YOLO网络的重排序层进行网络退化,并映射到FPGA上;采用动态量化、模块融合、双缓冲流水线、循环展开和分块等优化策略,设计可动态配置的加速IP,其中的卷积计算模块分别实现了基于Winograd和GEMM的快速卷积算法.实验结果表明,本系统的加速IP在PYNQ-Z2上获得了 51.89 GOP/s的计算性能,比基于典型滑动窗口卷积计算方法的性能提高了 0.76倍,加速单张图像的时延为433 ms,功耗为1.07 W,与Core i5-10500 CPU相比,能效是其365.27倍,实现了小型设备对手机镜片低时延、低功耗的多缺陷检测.
FPGA、YOLOv2、手机镜片检测、软硬协同检测、快速卷积算法
45
TP391(计算技术、计算机技术)
国家自然科学基金52179136
2023-01-16(万方平台首次上网日期,不代表论文的发表时间)
共8页
10-17