基于3D-SVD的时空行为定位算法
随着摄像头的普及,基于人工智能的行为分析技术在智能视频领域扮演着越来越重要的角色.现有的算法大多采用光流网络或者3D网络来获取行为的时间信息,但是光流网络和一般的3D网络计算量大,在同时进行分类和定位这两项任务时计算效率低.针对这一问题,本文构建了一个能够进行空间定位和分类的双流框架,在3D网络分支中采用SVD的思想分解3D卷积核以减少3D网络的参数,并利用动态规划算法高效的搜索最佳行为管道,在训练的过程中采用mixup算法对数据集进行扩充,增强训练的效果.最后,在UCF101-24和J-HMDB-21这两个被广泛使用的行为定位数据集上进行了实验验证,相比于基线算法,两个数据集的Frame-mAP分别提高了7.1%和4.8%,其中,J-HMDB-21在不同IOU下的Video-mAP分别提高了5.2%和4.8%.实验结果表明,本文提出的算法能有效提高行为定位能力,与其它算法相比获得了较好的结果.
行为定位;SVD;数据增强;行为管道
30
上海市科委项目19511132000
2021-12-21(万方平台首次上网日期,不代表论文的发表时间)
共9页
109-117