第一人称视角下的社会力优化多行人跟踪

引用

摘要：

目的多行人跟踪一直是计算机视觉领域最具挑战性的任务之一,然而受相机移动、行人频繁遮挡和碰撞影响导致第一人称视频中行人跟踪存在效率和精度不高的问题.对此,本文提出一种基于社会力模型优化的第一人称视角下的多行人跟踪算法.方法采用基于目标检测的跟踪算法,将跟踪问题简化为检测到的目标匹配问题,并且在初步跟踪之后进行社会力优化,有效解决频繁遮挡和碰撞行为导致的错误跟踪问题.首先,采用特征提取策略和宽高比重新设置的单步多框检测器(single shot multi-box detector,SSD),对输入的第一人称视频序列进行检测,并基于卷积神经网络(convolutional neural network,CNN)模型提取行人的表观特征,通过计算行人特征相似度获得初步的行人跟踪结果;然后,进行跟踪结果的社会力优化,一是定义行人分组行为,对每个行人跟踪目标进行分组计算,并通过添加分组标识,实现同组行人在遮挡的情况下的准确跟踪;二是通过定义的行人领域,对行人分组进行排斥计算,实现避免碰撞后的准确跟踪.结果在公用数据集ETH(eidgenfssische technische hochschule)、MOT16(multi-object tracking 16)和ADL (adelaide)的6个第一人称视频序列上与其他跟踪算法进行对比实验,本文算法的运行速度达到准实时的20.8帧/s,同时相比其他准实时算法,本文算法的整体跟踪性能MOTA(multiple object tracking accuracy)提高了2.5％.结论提出的第一人称视频中社会力优化的多行人跟踪算法,既能准确地在第一人称场景中跟踪多个行人,又能较好地满足实际应用需求.

关键词：第一人称视频、多行人跟踪、社会力优化、碰撞避免、分组行为

所属期刊栏目：25

分类号：TP301.6(计算技术、计算机技术)

资助基金：国家自然科学基金项目;云南省中青年学术和技术带头人后备人才培养计划项目;云南省应用研究基础计划面上项目

在线出版日期：2020-10-19（万方平台首次上网日期，不代表论文的发表时间）

页数：共13页

页码：1869-1881

英文信息展示

期刊专题