10.19678/j.issn.1000-3428.0063455
一种基于词频-逆文档频率和混合损失的表情识别算法
面部表情能自然高效地表达人类的心理活动和思想状态,影响着人们的沟通交流过程.在诸多智能化应用中,人脸表情识别是人类与机器间建立情感交互的重要基础.在细粒度人脸表情识别任务中,由于特征提取网络对表情产生区域的关键特征处理不足,从而引发细节特征信息丢失问题.提出一种词频-逆文档频率注意力机制TF-IDF SPA,通过该机制调整表情产生关键区域的注意力分布,强化网络对该区域关键细节特征的提取能力.同时,为了应对表情识别任务中普遍存在的类间差异小、类内差异大的问题,设计一种改进型混合加权损失函数,以增强表情类内聚拢性同时增大类间距离.依据数据集中样本的数量分布情况,动态调整损失函数的分类权重值,从而强化模型对小数据量样本的学习能力.在此基础上,将结构简单的TF-IDF SPA模块与卷积层共同堆叠以构建人脸表情识别网络.实验结果表明,该网络具有较好的人脸表情识别性能,在FER2013和CK+数据集上的分类准确率分别达到73.52%和98.27%.
表情识别、FER2013数据集、CK+数据集、词频-逆文档频率、损失函数、注意力机制
49
TP391(计算技术、计算机技术)
广西科技重大专项AA21077007
2023-01-16(万方平台首次上网日期,不代表论文的发表时间)
共9页
295-302,310