融合时空图卷积的多人交互行为识别

引用

摘要：

目的多人交互行为的识别在现实生活中有着广泛应用.现有的关于人类活动分析的研究主要集中在对单人简单行为的视频片段进行分类,而对于理解具有多人之间关系的复杂人类活动的问题还没有得到充分的解决.方法针对多人交互动作中两人肢体行为的特点,本文提出基于骨架的时空建模方法,将时空建模特征输入到广义图卷积中进行特征学习,通过谱图卷积的高阶快速切比雪夫多项式进行逼近.同时对骨架之间的交互信息进行设计,通过捕获这种额外的交互信息增加动作识别的准确性.为增强时域信息的提取,创新性地将切片循环神经网络(recurrent neural network,RNN)应用于视频动作识别,以捕获整个动作序列依赖性信息.结果本文在UT-Interaction数据集和SBU数据集上对本文算法进行评估,在UT-Interaction数据集中,与H-LSTCM(hierarchical long short-term concurrent memory)等算法进行了比较,相较于次好算法提高了0.7％,在SBU数据集中,相较于GC-NConv(semi-supervised classification with graph convolutional networks)、RotClips+MTCNN(rotating cliips+multi-task convolutional neural netowrk)、SGC(simplifying graph convolutional)等算法分别提升了 5.2％、1.03％、1.2％.同时也在SBU数据集中进行了融合实验,分别验证了不同连接与切片RNN的有效性.结论本文提出的融合时空图卷积的交互识别方法,对于交互类动作的识别具有较高的准确率,普遍适用于对象之间产生互动的行为识别.

关键词：动作识别、交互信息、时空建模、图卷积、切片循环神经网络(RNN)

所属期刊栏目：26

分类号：TP391.4(计算技术、计算机技术)

资助基金：国家自然科学基金项目;社会安全风险感知与防控大数据应用国家工程实验室主任基金项目

在线出版日期：2021-09-18（万方平台首次上网日期，不代表论文的发表时间）

页数：共11页

页码：1681-1691

英文信息展示

期刊专题