10.11772/j.issn.1001-9081.2020091427
优化LeNet-5网络的多角度头部姿态估计方法
针对在受到部分遮挡或角度过大无法定位面部关键特征点的情况下,传统的头部姿态估计方法的准确率低或无法进行头部姿态估计的问题,提出了优化LeNet-5网络的多角度头部姿态估计方法.首先,通过对卷积神经网络(CNN)的深度、卷积核大小等进行优化来更好地捕捉图像的全局特征;然后,改进池化层,用卷积操作代替池化操作来增强网络的非线性能力;最后,引入AdaBound优化器,并利用Softmax回归模型做姿态分类训练.训练中在自建数据集中增加遮挡头发、做出夸张表情和佩戴眼镜等动作来增强网络的泛化能力.实验结果表明,所提方法不需要定位面部关键特征点,在光照阴影、头发等遮挡情况下也可以实现抬头、低头、偏头等多角度转动下的头部姿态估计,在Pointing04公共数据集和CAS-PEAL-R1公共数据集上准确率达到了98.7%,运行速度平均在每秒22~29帧.
头部姿态估计、面部关键特征点、LeNet-5网络、卷积神经网络、姿态分类
41
TP391.41(计算技术、计算机技术)
上海市教育委员会晨光计划资助项目AASH1702
2021-07-01(万方平台首次上网日期,不代表论文的发表时间)
共6页
1667-1672