深度学习的人-物体交互检测研究进展

引用

摘要：

人-物体交互检测(HOI),就是把图像作为输入,检测出图像中存在交互行为的人和物体以及他们之间的交互动词.它是计算机视觉范畴里继目标检测、图像分割和目标跟踪之后又一新任务,旨在对图像进行更深层的理解.针对目前基于深度学习的HOI检测综述性文章的空白,以HOI检测方法的发展历程为主线,对基于深度学习的HOI检测方法进行了分类与分析.首先简要总结了早期的技术方法,然后根据模型结构将现有算法分为两阶段方法和一阶段方法并对一些代表性算法进行分析介绍.将两阶段方法分为融入注意力、图模型以及姿势和身体部位三类进行重点论述,总结了每类方法的基本思想与优缺点.此外,还详细介绍了HOI检测任务的实验评价指标、基准数据集和大多数现有方法的实验结果,对不同类别的方法取得的结果进行说明.最后对该技术面临的主要挑战进行总结分析并对未来发展趋势进行展望.

关键词：人-物体交互检测(HOI);计算机视觉;目标检测;深度学习

所属期刊栏目：16

分类号：TP301(计算技术、计算机技术)

资助基金：中国博士后科学基金特别资助项目;山东省自然科学基金

在线出版日期：2022-02-25（万方平台首次上网日期，不代表论文的发表时间）

页数：共14页

页码：323-336

英文信息展示

期刊专题