改进视觉Transformer的人脸识别方法

引用

摘要：

目前大多数人脸识别方法依赖于卷积神经网络,通过级联的形式构建多层处理单元,利用卷积操作融合局部特征,忽略了人脸全局语义信息,缺乏对人脸重点区域的关注度.针对上述问题,提出一种基于改进视觉Transformer的人脸识别方法,引入Shuffle Transformer作为特征提取骨干网络,通过自注意力机制以及Shuffle操作捕捉特征图全局信息,建立特征点之间的长距离依赖关系,提高模型的特征感知能力;同时,结合ArcFace损失函数和中心损失函数的特点,设计融合损失作为目标函数,利用类内约束扩大角度间隔,提高特征空间的辨别性.该方法在LFW、CALFW、CPLFW、AgeDB-30和CFP五个具有挑战性的基准测试人脸数据集上分别取得了99.83％、95.87％、90.05％、98.05％、97.23％的平均准确率,能够有效提升人脸特征提取能力,识别效果优于同等规模卷积神经网络.

关键词：人脸识别、视觉Transformer、自注意力机制、ArcFace损失函数

所属期刊栏目：59

分类号：TP391.4(计算技术、计算机技术)

资助基金：陕西省重点研发计划项目2020ZDLGY04-04

在线出版日期：2023-04-27（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：117-126

英文信息展示

期刊专题