一种基于词频-逆文档频率和混合损失的表情识别算法

引用

摘要：

面部表情能自然高效地表达人类的心理活动和思想状态,影响着人们的沟通交流过程.在诸多智能化应用中,人脸表情识别是人类与机器间建立情感交互的重要基础.在细粒度人脸表情识别任务中,由于特征提取网络对表情产生区域的关键特征处理不足,从而引发细节特征信息丢失问题.提出一种词频-逆文档频率注意力机制TF-IDF SPA,通过该机制调整表情产生关键区域的注意力分布,强化网络对该区域关键细节特征的提取能力.同时,为了应对表情识别任务中普遍存在的类间差异小、类内差异大的问题,设计一种改进型混合加权损失函数,以增强表情类内聚拢性同时增大类间距离.依据数据集中样本的数量分布情况,动态调整损失函数的分类权重值,从而强化模型对小数据量样本的学习能力.在此基础上,将结构简单的TF-IDF SPA模块与卷积层共同堆叠以构建人脸表情识别网络.实验结果表明,该网络具有较好的人脸表情识别性能,在FER2013和CK+数据集上的分类准确率分别达到73.52％和98.27％.

关键词：表情识别、FER2013数据集、CK+数据集、词频-逆文档频率、损失函数、注意力机制

所属期刊栏目：49

分类号：TP391(计算技术、计算机技术)

资助基金：广西科技重大专项AA21077007

在线出版日期：2023-01-16（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：295-302,310

英文信息展示

期刊专题