DOI：10.11975/j.issn.1002-6819.2022.21.019

基于改进YOLOv4模型的全景图像苹果识别

引用

摘要：

苹果果园由于密植栽培模式,果树之间相互遮挡,导致苹果果实识别效果差,并且普通的图像采集方式存在图像中果实重复采集的问题,使得果实计数不准确.针对此类问题,该研究采用全景拍摄的方式采集苹果果树图像,并提出了一种基于改进YOLOv4和基于阈值的边界框匹配合并算法的全景图像苹果识别方法.首先在YOLOv4主干特征提取网络的Resblock模块中加入scSE注意力机制,将PANet模块中的部分卷积替换为深度可分离卷积,且增加深度可分离卷积的输出通道数,以增强特征提取能力,降低模型参数量与计算量.将全景图像分割为子图像,采用改进的YOLOv4模型进行识别,通过对比Faster R-CNN、CenterNet、YOLOv4系列算法和YOLOv5系列算法等不同网络模型对全景图像的苹果识别效果,改进后的YOLOv4网络模型精确率达到96.19％,召回率达到了95.47％,平均精度达到97.27％,比原YOLOv4模型分别提高了1.07、2.59、2.02个百分点.采用基于阈值的边界框匹配合并算法,将识别后子图像的边界框进行匹配与合并,实现全景图像的识别,合并后的结果其精确率达到96.17％,召回率达到95.63％,F1分数达到0.96,平均精度达到95.06％,高于直接对全景图像苹果进行识别的各评价指标.该方法对自然条件下全景图像的苹果识别具有较好的识别效果.

关键词：图像识别、YOLOv4、苹果、scSE、深度可分离卷积、边界框匹配合并

所属期刊栏目：38

分类号：TP391.4(计算技术、计算机技术)

资助基金：国家自然科学基金62106065

在线出版日期：2023-02-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：159-168

英文信息展示

期刊专题