人脸识别背后的数据清理问题研究
人脸识别技术在深度卷积神经网络(deep convolution neural networks,DCNN)的快速发展下取得了显著的成就.这些成果主要体现在更深层次的DCNN架构和更大的训练数据库.然而,由大多数私人公司持有的大型数据库(百万级)并不对外公开,即使当前部分开放的大型数据库,因为标注信息过少,无法保证精度,会影响DCNN的训练.本文提出了一种易于使用的多角度清理图像方法来提高数据的准确性:通过人脸检测算法清除掉无法检测到人脸的图像;在清理后的数据集上利用已有模型提取图像特征,并计算相似度,进而统计出一类人脸图像中每一张图像与其他图像不相似的数目,根据改进参数清理数据.实验表明,清理后的数据库训练模型在LFW和Youtube Face数据集上测试的精度得到了提升,使用较小规模数据集情况下,在LFW数据集上取得了99.17%的准确率,在Youtube Face数据集也达到了93.53%的准确率.
深度卷积神经网络、DCNN、清理图像、人脸识别、大型数据库
12
TP391.4(计算技术、计算机技术)
国家自然科学基金项目61202191;计算智能重庆市重点实验室开放基金项目CQ-LCI-2013-06;国家重点研发计划项目2016YFC0802209
2017-12-18(万方平台首次上网日期,不代表论文的发表时间)
共8页
616-623