10.3969/j.issn.1673-7938.2023.05.003
基于卷积Token的Vision Transformer 模型的人脸表情识别
人脸表情识别有着广泛的应用.本文使用基于卷积Token的Vision Transformer的混合模型实现表情识别.混合模型能够更好地捕捉人脸表情的局部特征以及局部特征之间的相关性.实验使用RafDB和Fer2013Plus数据集,并对比了 ResNet、DenseNet、Swin Transformer和CVT模型的精度和分类混合矩阵分析在人脸表情识别中的表现.
卷积Token、Vision Transformer、混合模型、表情识别、混合矩阵
33
TP391.41(计算技术、计算机技术)
北华航天工业学院科研基金项目;河北省高等学校科学技术研究项目;北华航天工业学院研究生创新资助项目
2023-11-27(万方平台首次上网日期,不代表论文的发表时间)
共3页
8-10