基于改进ViT的红外人体图像步态识别方法研究

引用

摘要：

针对卷积神经网络在步态识别时准确率易饱和现象,以及VisionTransformer(ViT)对步态数据集拟合效率较低的问题,提出构建一个对称双重注意力机制模型,保留行走姿态的时间顺序,用若干独立特征子空间有针对性地拟合步态图像块;同时,采用对称架构的方式,增强注意力模块在拟合步态特征时的作用,并利用异类迁移学习进一步提升特征拟合效率.将该模型运用在中科院CASIA C红外人体步态库中进行多次仿真实验,平均识别准确率达到96.8％.结果表明,本文模型在稳定性、数据拟合速度以及识别准确率3方面皆优于传统ViT模型和CNN对比模型.

关键词：步态识别、对称双重注意力机制、迁移学习、红外人体图像、Vision Transformer、卷积神经网络

所属期刊栏目：44

分类号：TN219;TP181(光电子技术、激光技术)

资助基金：云南省应用基础研究计划重点项目;云南师范大学研究生科研创新基金项目

在线出版日期：2023-02-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：71-78

英文信息展示

期刊专题