融合Swin Transformer的虫害图像实例分割优化方法研究
[目的]为了实现对虫害的精准监测,提出了一种融合Swin Transformer的图像实例分割优化方法,以期有效解决复杂真实场景下多幼虫个体图像识别分割困难的问题.[方法]选用Swin Transformer模型,改进Mask R-CNN实例分割模型的主干网部分,对黄野螟幼虫虫害图像进行识别分割.针对不同结构参数的Swin Transformer模型与ResNet模型,调整各层的输入输出维度,将其分别设置为Mask R-CNN的主干网进行对比实验,从定量与定性两个角度分析不同主干网的Mask R-CNN模型对黄野螟幼虫的识别分割精度与效果,确定最佳模型结构.[结果]①该方法在虫害识别框选方面的测度(F1)分数可达89.7%,平均精度(AP)可达88.0%;在虫害识别分割方面的F1分数可达84.3%,AP可达82.2%.相较于Mask R-CNN,在目标框选与目标分割方面分别提升8.75%与8.40%.②对于小目标虫害识别分割任务,该方法在虫害识别框选方面的F1分数可达88.4%,AP可达86.3%;在虫害识别分割方面的F1分数可达84.0%,AP可达81.7%.相较于Mask R-CNN,在目标框选与目标分割方面分别提升9.30%与9.45%.[结论]对于复杂真实场景下的图像实例分割任务,其识别分割效果极大地依赖于模型对图像特征的提取能力,而融合了Swin Transformer的Mask R-CNN实例分割模型,在主干网的特征提取能力更强,模型整体的识别分割效果更好,可为虫害的识别监测提供技术支撑,同时为保护农、林、牧等产业资源提供解决方案.
虫害识别、Swin Transformer、Mask R-CNN、实例分割、土沉香、黄野螟
47
TP39;S433;S763(计算技术、计算机技术)
中央级公益性科研院所基本科研业务费专项资金项目CAFYBB2021ZB002
2023-06-02(万方平台首次上网日期,不代表论文的发表时间)
共10页
1-10