混凝土坝面作业场景智能识别ResNet50-SEMSF方法
为提高混凝土坝面作业场景识别工作效率,提出了一种混凝土坝面作业场景智能识别方法(ResNet50-SEMSF).将采集的坝面施工现场监控视频分割为图像,分析混凝土坝面作业人、机、料、环境等实体要素图像特征,界定坝面作业典型场景;以残差网络(ResNet50)为骨干网络结构,引入挤压激励(SE)注意力机制,关注不同通道间特征关系,提升坝面作业场景图像中多目标实体要素关键特征表达能力;融合下采样多尺度特征,保留坝面作业场景图像低级特征和高级语义信息,增强模型对图像不同层次特征的理解能力,克服尺度变化、目标变形等问题.对比分析其他3种卷积神经网络模型试验结果,使用梯度类激活映射(Grad-CAM)可视化方法,解释ResNet50-SEMSF模型对场景类别中实体要素信息的关注程度.结果表明:ResNet50-SEMSF识别效果明显优于ResNet50、MobileNetV2、VGG16等经典网络模型,表明ResNet50-SEMSF模型用于混凝土坝面作业场景智能识别的可行性,为混凝土坝面施工安全管理工作提供参考.
混凝土坝、坝面作业、深度学习、注意力机制、场景智能识别
43
TV642;TV52;TP391.4(水利枢纽、水工建筑物)
国家自然科学基金;国家自然科学基金
2024-02-01(万方平台首次上网日期,不代表论文的发表时间)
共10页
99-108