10.3969/j.issn.1006-9348.2021.12.078
基于时序信息和注意力机制的视频目标检测
目前,基于深度学习的图像目标检测算法已经趋于成熟,但其无法利用视频中独特的时序信息,会使检测精度产生大幅度的下降.为了更好的进行视频目标检测,应当充分挖掘视频图像之间的联系,利用视频中的时序信息.因此提出了基于时序信息和注意力机制的视频目标检测算法(TIAM).算法中加入了运动历史图像,表征视频中的时序信息,并为模型提供目标的运动信息;结合注意力机制,使模型更加关注目标区域,提高了区域特征的代表性.在大规模数据集ImageNet VID上进行实验,验证了算法的有效性,平均精度均值达到了先进水平.
计算机视觉;视频目标检测;运动历史图像;特征融合;注意力机制
38
TP391.41(计算技术、计算机技术)
北京市社会科学基金;国家社会科学基金;北京市自然科学基金;北京市教委科研团队建设项目;北京市科技计划
2022-01-17(万方平台首次上网日期,不代表论文的发表时间)
共6页
380-385