基于视觉注意力的人体行为识别
视频中人体行为识别是近年来计算机视觉中的一个重要研究领域,但是现有的方法对于视频表示方式存在不足,无法聚焦于图像内的显著区域.提出了一种基于视觉注意力的深度卷积神经网络,可以有效地为视频表示特征附加一个权重,对特征中的有益区域进行注意,实现更加准确的行为识别.在自建的Oilfield-7油田数据集和HMDB51数据集上进行了实验,以此来验证适用于油田现场人体行为所提出的网络模型的有效性.实验结果表明,所提的方法与已取得优异表现的双流架构相比具有一定的优越性.
行为识别、双流架构、卷积神经网络(CNN)、视频表示、视觉注意力
28
国家科技部创新方法工作专项2015IM010300
2019-06-03(万方平台首次上网日期,不代表论文的发表时间)
共7页
42-48