一种与说话内容无关的声纹鉴别认证方法
本发明属于模式识别和身份认证技术领域,特别涉及通过人类声纹信息进行鉴别与认证的方法。本发明包括人类声纹信息的提取和处理,声纹特征信息的抗噪、抗信道干扰处理,个人声纹信息模型建立,个人声纹信息的检测与认证,声纹信息背景库建立及调整方法,似然得分投影方法。本发明具有鉴别认证准确率高、鉴别认证速度快、对声纹信号要求低等优点,可广泛应用于司法、公安、银行、国防等需要声纹鉴别、认证的部门和单位。
发明专利
CN201010126049.3
2010-03-17
CN102194455A
2011-09-21
G10L15/02(2006.01)I
博石金(北京)信息技术有限公司
不公告发明人
100043 北京市石景山区石景山路40号信安大厦3层E
北京;11
一种与说话内容无关的声纹鉴别认证方法,其特征在于该方法包括以下步骤:(1)从大量说话人的声纹信号中提取声纹特征信息,形成背景特征矢量序列;(2)将背景特征矢量序列做规整处理,如去均值处(CMS)、短时高斯化(ShortTime?Gausianization)、特征映射(Feature?Mapping)等;(3)将规整处理后的背景特征矢量序列通过特征分解技术,如主分量分析(PCA)、核?主分量分析(KPCA)、线性分量分析(LDA)、异质线性分量分析(HLDA)等,得到区分性分析矩阵和降维的最终的背景特征矢量序列;(4)将最终的背景特征矢量序列聚类成M类高斯混合空间背景模型;(5)从大量不同信道、不同说话人的语音信号中提取声纹特征信息,形成信道背景特征矢量序列,并将该特征矢量序列做规整处理及区分性处理,再通过因子分析技术得到信道信息背景矩阵;(6)从样本说话人语音信号中提取其声纹特征信息,形成样本特征矢量序列,并通过规整处理、区分性处理得到最终样本特征矢量序列;(7)将样本特征矢量序列通过自适应模型调整方法从高斯混合空间背景模型调整为含有其个性信息的样本说话人模型;(8)从检材说话人语音信号中提取其声纹特征信息,形成检材特征矢量序列,并通过规整处理、区分性处理得到最终检材特征矢量序列;(9)将最终检材特征矢量序列通过信道背景矩阵和样本说话人模型,调整为符合样本信道特性的特征矢量序列;(10)计算调整后的检材特征矢量序列与样本说话人模型、背景模型的平均似然比得分的差,作为结果得分;(11)将结果得分通过分数投影方法映射成为概率分数作为最终鉴别结果返回;