增强二阶网络调制的目标跟踪

引用

摘要：

目的表观模型对视觉目标跟踪的性能起着决定性的作用.基于网络调制的跟踪算法通过构建高效的子网络学习参考帧目标的表观信息,以用于测试帧目标的鲁棒匹配,在多个目标跟踪数据集上表现优异.但是,这类跟踪算法忽视了高阶信息对鲁棒建模物体表观的重要作用,致使在物体表观发生大尺度变化时易产生跟踪漂移.为此本文提出全局上下文信息增强的二阶池化调制子网络,以学习高阶特征提升跟踪器的性能.方法首先,利用卷积神经网络(convolutional neural networks,CNN)提取参考帧和测试帧的特征;然后,对提取的特征采用不同方向的长短时记忆网络(long shot-term memory networks,LSTM)捕获每个像素的全局上下文信息,再经过二阶池化网络提取高阶信息;最后,通过调制机制引导测试帧学习最优交并比预测.同时,为提升跟踪器的稳定性,在线跟踪通过指数加权平均自适应更新物体表观特征.结果实验结果表明,在OTB100(object tracking benchmark)数据集上,本文方法的成功率为67.9％,超越跟踪器ATOM(accurate tracking by overlap maximization)1.5％;在VOT(visual object tracking) 2018数据集上平均期望重叠率(expected average overlap,EAO)为0.44,超越ATOM 4％.结论本文通过构建全局上下文信息增强的二阶池化调制子网络来学习高效的表观模型,使跟踪器达到目前领先的性能.

关键词：视觉目标跟踪(VOT)、卷积神经网络(CNN)、网络调制、上下文信息、注意力机制

所属期刊栏目：26

分类号：TP391.4(计算技术、计算机技术)

资助基金：国家新一代人工智能重大项目;国家自然科学基金项目

在线出版日期：2021-04-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共11页

页码：516-526

英文信息展示

期刊专题