基于编解码器的电力施工场景可控图像字幕生成
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.13335/j.1000-3673.pst.2021.2400

基于编解码器的电力施工场景可控图像字幕生成

引用
电力施工场景图像字幕生成采用基于深度学习的编解码技术理解图像信息,并转换为文字描述输出,从而预警安全隐患,丰富了传统图像分析技术的输出形式.传统图像字幕生成方法缺乏可控性且细节描述不充分,针对电力施工场景图像描述的研究匮乏.为此,该文提出一种基于编解码器的可控图像字幕生成优化方法.引入新的特征提取模型,以FVC R-CNN(faster and visual commonsense region-convolutional neural network)模型作为编码器,提取图像的显著特征和视觉常识特征,并改进激活函数以得到改进的基于M-tanh的长短时记忆(M-tanh long short-term memory,MT-LSTM)神经网络用于特征解码,最后通过多分枝决策策略优化输出.在Ubuntu16.04和PyTorch深度学习框架下对电力场景描述数据集进行了训练和测试,实验结果表明图像字幕生成准确率不仅得到显著提高,而且增强了场景描述的可控性,可有力提升电力施工现场的安全管理智能化水平.

电力施工场景、可控图像字幕、FVC R-CNN模型、MT-LSTM神经网络、激活函数、多分枝决策策略

46

TM721(输配电工程、电力网及电力系统)

国家自然科学基金61802250

2022-07-20(万方平台首次上网日期,不代表论文的发表时间)

共10页

2572-2580,中插14

相关文献
评论
暂无封面信息
查看本期封面目录

电网技术

1000-3673

11-2410/TM

46

2022,46(7)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn