基于Fisher判别字典学习的说话人识别
稀疏表示已成功应用于说话人识别领域。在稀疏表示中,构造好的字典起着重要的作用。该文将 Fisher准则的结构化字典学习方法引入说话人识别系统。在判别字典的学习过程中,每一个字典对应一个类标签,因此同类别训练样本的重构误差较小。同时,保证训练样本的稀疏编码系数类内误差最小,类间误差最大。在NIST SRE 2003数据库上,实验结果表明该算法得到的等错误率是7.62%,基于余弦距离打分的i-vector的等错误率是6.7%。当两个系统融合后,得到的等错误率是5.07%。
说话人识别、字典学习、稀疏表示、Fisher判别
38
TP391.42(计算技术、计算机技术)
国家自然科学基金61071181,61471145;国家自然科学基金重大研究计划91120303 Foundation Items:The National Natural Science Foundation of China61071181,61471145;The Major Research Plan of the National Natural Science Foundation of China91120303
2016-04-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
367-372