基于改进ViT的红外人体图像步态识别方法研究
针对卷积神经网络在步态识别时准确率易饱和现象,以及VisionTransformer(ViT)对步态数据集拟合效率较低的问题,提出构建一个对称双重注意力机制模型,保留行走姿态的时间顺序,用若干独立特征子空间有针对性地拟合步态图像块;同时,采用对称架构的方式,增强注意力模块在拟合步态特征时的作用,并利用异类迁移学习进一步提升特征拟合效率.将该模型运用在中科院CASIA C红外人体步态库中进行多次仿真实验,平均识别准确率达到96.8%.结果表明,本文模型在稳定性、数据拟合速度以及识别准确率3方面皆优于传统ViT模型和CNN对比模型.
步态识别、对称双重注意力机制、迁移学习、红外人体图像、Vision Transformer、卷积神经网络
44
TN219;TP181(光电子技术、激光技术)
云南省应用基础研究计划重点项目;云南师范大学研究生科研创新基金项目
2023-02-16(万方平台首次上网日期,不代表论文的发表时间)
共8页
71-78