10.11772/j.issn.1001-9081.2019030540
基于多尺度核特征卷积神经网络的实时人脸表情识别
针对人脸表情识别的泛化能力不足、稳定性差以及速度慢难以满足实时性要求的问题,提出了一种基于多尺度核特征卷积神经网络的实时人脸表情识别方法.首先,提出改进的MobileNet结合单发多盒检测器(MSSD)轻量化人脸检测网络,并利用核相关滤波(KCF)模型对检测到的人脸坐标信息进行跟踪来提高检测速度和稳定性;然后,使用三种不同尺度卷积核的线性瓶颈层构成三条支路,用通道合并的特征融合方式形成多尺度核卷积单元,利用其多样性特征来提高表情识别的精度;最后,为了提升模型泛化能力和防止过拟合,采用不同的线性变换方式进行数据增强来扩充数据集,并将FER-2013人脸表情数据集上训练得到的模型迁移到小样本CK+数据集上进行再训练.实验结果表明,所提方法在FER-2013数据集上的识别率达到73.0%,较Kaggle表情识别挑战赛冠军提高了1.8%,在CK+数据集上的识别率高达99.5%.对于640×480的视频,人脸检测速度达到每秒158帧,是主流人脸检测网络多任务级联卷积神经网络(MTCNN)的6.3倍,同时人脸检测和表情识别整体速度达到每秒78帧.因此所提方法能够实现快速精确的人脸表情识别.
人脸表情识别、卷积神经网络、人脸检测、核相关滤波、迁移学习
39
TP391.4(计算技术、计算机技术)
国家自然科学基金资助项目61771411;四川省科技计划项目2019YJ0449;西南科技大学研究生创新基金资助项目18ycx123
2019-10-16(万方平台首次上网日期,不代表论文的发表时间)
共7页
2568-2574