基于改进的三维卷积神经网络的动作识别

引用

摘要：

基于视频的行为识别技术在计算机视觉领域有着广泛的应用,针对当前存在的3D网络模型卷积运算参数量大,运算时间长,调参困难等问题,提出一种改进的三维卷积神经网络模型.该模型将传统的3D CNN网络结构拆分为空间流和时间流进行数据运算,并借鉴ResNet网络的设计思想,减少参数设置,避免梯度消失.实验结果表明,文中模型在保证识别精度的条件下,训练速度得到了大幅提升.相较于传统行为识别算法,该模型能取得更高的识别精度并提高运算效率,体现出模型算法的优越性与鲁棒性.

关键词：卷积神经网络、3D CNN、残差网络、双流网络、动作识别

所属期刊栏目：19

分类号：TP18(自动化基础理论)

资助基金：河北建筑工程学院硕士研究生创新基金项目XY2023079

在线出版日期：2023-09-27（万方平台首次上网日期，不代表论文的发表时间）

页数：共4页

页码：5-7,12

期刊专题