引导式的卷积神经网络视频行人动作分类改进方法
如何提升网络模型对时域信息的理解能力,是基于3D卷积神经网络视频行人动作分类方法需要解决的问题之一.提出一种主导层优化模块,在网络训练过程中,利用当前时域动态信息学习能力最强的卷积层作为主导层来引导网络权重参数的更新,使各卷积层对动态信息的学习能力逐渐增强,从而改进卷积神经网络模型对时域动态信息的理解能力.仿真结果显示,添加主导层优化模块后的ResNeXt-50网络与ResNeXt-101网络在UCF-101和HMDB-51数据库上的训练收敛速度都有所增加,测试结果的准确率均有不同程度提升.
视频行人动作分类;动态信息学习能力;引导优化;3D卷积神经网络;时域动态信息理解能力
46
P237(摄影测量学与测绘遥感)
辽宁省自然科学基金20170540192,20180550866
2021-10-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
1241-1246