基于3D全时序卷积神经网络的视频显著性检测
视觉是人类感知世界的重要途径之一.视频显著性检测旨在通过计算机模拟人类的视觉注意机制,智能地检测出视频中的显著性物体.目前,基于传统方法的视频显著性检测已经达到一定的水平,但是在时空信息一致性利用方面仍不能令人满意.因此,文中提出了一种基于全时序卷积神经网络的视频显著性检测方法.首先,利用全时序卷积对输入视频进行空间信息和时间信息的时空特征提取;然后,利用3D池化层进行降维;其次,在解码层中用3D反卷积和3D上采样对前端特征进行解码;最后,通过把时空信息有机地提取与融合,来有效地提升显著图的质量.实验结果表明,所提算法在3个广泛使用的视频显著性检测数据集(DAVIS,FBMS,SegTrack)上的性能优于当前主流的视频显著性检测方法.
显著性检测、时空特征、全时序卷积、神经网络
47
TP391(计算技术、计算机技术)
国家自然科学基金;泰山学者青年专家支持计划
2020-08-26(万方平台首次上网日期,不代表论文的发表时间)
共7页
195-201