基于改进的三维卷积神经网络的动作识别
基于视频的行为识别技术在计算机视觉领域有着广泛的应用,针对当前存在的3D网络模型卷积运算参数量大,运算时间长,调参困难等问题,提出一种改进的三维卷积神经网络模型.该模型将传统的3D CNN网络结构拆分为空间流和时间流进行数据运算,并借鉴ResNet网络的设计思想,减少参数设置,避免梯度消失.实验结果表明,文中模型在保证识别精度的条件下,训练速度得到了大幅提升.相较于传统行为识别算法,该模型能取得更高的识别精度并提高运算效率,体现出模型算法的优越性与鲁棒性.
卷积神经网络、3D CNN、残差网络、双流网络、动作识别
19
TP18(自动化基础理论)
河北建筑工程学院硕士研究生创新基金项目XY2023079
2023-09-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
5-7,12