基于混合分组扩张卷积的玉米植株图像深度估计

引用

摘要：

[目的]研究面向玉米田间场景的图像深度估计方法,解决深度估计模型因缺少有效光度损失度量而易产生的精度不足问题,为田间智能农业机械视觉系统设计及导航避障等提供技术支持.[方法]应用双目相机作为视觉传感器,提出一种基于混合分组扩张卷积的无监督场景深度估计模型.设计一种混合分组扩张卷积结构及对应的自注意力机制,由此构建反向残差模块和深度估计骨干网络;并将光照不敏感的图像梯度和Gabor纹理特征引入视图表观差异度量,构建模型优化目标.以田间玉米植株图像深度估计为例,开展模型的训练和测试试验.[结果]与固定扩张因子相比,采用混合分组扩张卷积使田间玉米植株深度估计平均相对误差降低了63.9%,平均绝对误差和均方根误差则分别降低 32.3%和 10.2%,模型精度显著提高;图像梯度、Gabor纹理特征和自注意力机制的引入,使田间玉米植株深度估计平均绝对误差和均方根误差进一步降低 3.2%和 4.6%.增加浅层编码器的网络宽度和深度可显著提高模型深度估计精度,但该处理对深层编码器的作用不明显.该研究设计的自注意力机制对编码器浅层反向残差模块中不同扩张因子的卷积分组体现出选择性,说明该机制具有自主调节感受野的能力.与Monodepth2 相比,该研究模型田间玉米植株深度估计的平均相对误差降低 48.2%,平均绝对误差降低 17.1%;在 20m采样范围内,估计深度的平均绝对误差小于 16 cm,计算速度为 14.3 帧/s.[结论]基于混合分组扩张卷积的图像深度估计模型优于现有方法,有效提升了深度估计的精度,能够满足田间玉米植株图像的深度估计要求.

关键词：深度估计、扩张卷积、自注意力、无监督学习、玉米植株图像

所属期刊栏目：45

分类号：TP183;S126(自动化基础理论)

资助基金：国家重点研发计划;辽宁省教育厅科学研究项目;辽宁省教育厅科学研究项目

在线出版日期：2024-01-23（万方平台首次上网日期，不代表论文的发表时间）

页数：共13页

页码：280-292

英文信息展示

期刊专题