课堂场景下改进MobileNetv3人脸识别算法
针对课堂场景中人脸识别性能不佳的问题,提出一种基于改进MobileNetv3的人脸识别算法.首先,利用全局逐通道卷积层(global depthwise convolution,GDConv)优化特征提取网络,根据特征提取网络最后一层特征图中不同感知单元的重要性程度对其赋予不同的权重,提取更多人脸有效特征,同时减少干扰信息影响.然后,采用协调注意力机制(coordinate at-tention,CA)同时提取人脸特征位置信息和通道信息,增强模型的特征表达能力.此外,通过优化模型提取的特征向量维度,降低遮挡对人脸识别算法精度的影响.最后,使用Softmax损失函数和Center损失函数联合监督模型训练,使学习到的特征类内距离更加紧凑,类间距离更加发散.实验结果表明,算法在识别准确率和速度方面均优于其他比较算法,在LFW数据集上人脸识别准确率可达96.1%,在真实课堂场景中识别精度为93.54%,速率为124 fps.
课堂场景、人脸识别、MobileNetv3、协调注意力机制、联合监督
41
TP391.9(计算技术、计算机技术)
国家自然科学基金;西安工程大学研究生创新基金项目
2023-02-22(万方平台首次上网日期,不代表论文的发表时间)
共9页
47-55