基于深度残差注意力的图像事件描述

引用

摘要：

图像事件描述是根据图像特征数据再结合自然语言处理技术,输出图像事件的语句描述的技术.图像事件的描述,对图片分类、查询等有着极高效率,为了达到更精确的描述效果,本文提出基于深度残差注意力的图像事件描述方法.该方法以ResNet的网络结构为基础,联合分离出的全局注意力与局部注意力,关注图像事件中心事件,生成图像事件描述.在COCO数据集上的实验表明,本文提出的方法能更好关注事件发生区域,对抽象事件描述更为准确.

关键词：图像事件描述、深度学习、注意力机制

所属期刊栏目：17

分类号：TP18(自动化基础理论)

资助基金：本文得到浙江省自然科学基金项目;嘉兴市级公益性研究计划项目;国家级大学生创新创业训练计划项目;嘉兴学院重点SRT项目资助

在线出版日期：2021-03-17（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：210-212

英文信息展示

期刊专题