10.11975/j.issn.1002-6819.2019.03.020
基于R-FCN深度卷积神经网络的机器人疏果前苹果目标的识别
疏果前期苹果背景复杂、光照条件变化、重叠及被遮挡,特别是果实与背景叶片颜色极为相近等因素,给其目标识别带来很大困难.为识别疏果前期的苹果目标,提出基于区域的全卷积网络(region-based fully convolutional network,R-FCN)的苹果目标识别方法.该方法在研究基于ResNet-50和ResNet-101的R-FCN结构及识别结果的基础上,改进设计了基于ResNet-44的R-FCN,以提高识别精度并简化网络.该网络主要由ResNet-44全卷积网络、区域生成网络(Region Proposal Network,RPN)及感兴趣区域(Region of Interest,RoI)子网构成.ResNet-44全卷积网络为基础网络,用以提取图像的特征,RPN根据提取的特征生成RoI,然后RoI子网根据ResNet-44提取的特征及RPN输出的RoI进行苹果目标的识别与定位.对采集的图像扩容后,随机选取23591幅图像作为训练集,4739幅图像作为验证集,对网络进行训练及参数优化.该文提出的改进模型在332幅图像组成的测试集上的试验结果表明,该方法可有效地识别出重叠、被枝叶遮挡、模糊及表面有阴影的苹果目标,识别的召回率为85.7%,识别的准确率为95.1%,误识率为4.9%,平均速度为0.187 s/幅.通过与其他3种方法进行对比试验,该文方法比Faster R-CNN、基于ResNet-50和ResNet-101的R-FCN的F1值分别提高16.4、0.7和0.7个百分点,识别速度比基于ResNet-50和ResNet-101的R-FCN分别提高了0.010和0.041 s.该方法可实现传统方法难以实现的疏果前苹果目标的识别,也可广泛应用于其他与背景颜色相近的小目标识别中.
图像处理、算法、图像识别、小苹果、目标识别、深度学习、R-FCN
35
TP391.41(计算技术、计算机技术)
国家高技术研究发展计划863计划资助项目2013AA100304
2019-04-11(万方平台首次上网日期,不代表论文的发表时间)
共8页
156-163