10.3969/j.issn.1003-3254.2020.05.037
基于多粒度视频信息和注意力机制的视频场景识别
视频场景识别是机器学习和计算机视觉一个重要的研究领域.但是当前对于视频场景识别的探索工作还远远不够,而且目前提出的模型大都使用视频级的特征信息,忽略了多粒度的视频特征关联.本文提出了一种基于多粒度的视频特征的注意力机制的模型架构,可以动态高效的利用各维度视频信息之间存在的丰富的语义关联,提高识别准确度.本文在中国多媒体大会(CCF ChinaMM 2019)最新推出的VideoNet数据集上进行了实验,实验结果表明基于多粒度的视频特征的注意力机制的模型与传统方法相比具有明显的优越性.
视频场景识别、注意力机制、多粒度视频信息、卷积神经网络、检测网络
29
山东省重点研发计划;中央高校自主创新科研计划
2020-05-28(万方平台首次上网日期,不代表论文的发表时间)
共5页
252-256