一种基于局部学习的说话人识别方法

引用

摘要：

一种基于局部学习的说话人识别方法，包括训练阶段与识别阶段，训练阶段包括：将训练数据通过提取特征和聚类方法分为特征空间上的多类训练集；针对每类训练集进行局部学习，通过概率线性判别分析方法获得多个模型；识别阶段包括：对待识别数据提取特征并进行分类判决得到特征空间上的多类待识别集；针对每类待识别集进行局部学习，根据训练数据得到的多个模型计算每类待识别集的后验概率作为结果；本发明应用于说话人识别中的说话人鉴别和说话人确认场景，可以降低由于异构性数据引起的错误识别率，最后每类待识别集的后验概率信息作为结果被系统输出。

专利类型：发明专利

申请/专利号：CN201210548563.5

申请日期：2012-12-17

公开/公告号：CN103035239A

公开/公告日：2013-04-10

主分类号：G10L15/06(2013.01)I

申请/专利权人:清华大学

发明/设计人:杨毅;陈国顺;马欣

主申请人地址:100084 北京市海淀区100084信箱82分箱清华大学专利办公室

专利代理机构:西安智大知识产权代理事务所 61215

代理人:贾玉健

国别省市代码:北京;11

权利要求：

一种基于局部学习的说话人识别方法，包括训练阶段与识别阶段，其特征在于，训练阶段包括：将训练数据通过提取特征和聚类方法分为特征空间上的多类训练集；针对每类训练集进行局部学习，通过概率线性判别分析方法获得多个模型Xi，j，c＝μc+Fchi，c+Gcwi，j，c+εi，j，c；其中，X代表训练数据，i代表第i个说话人，j代表第j个数据矢量，c代表第c类，μc为第c类训练数据的均值矢量，矩阵Fc代表第c类训练数据的类间子空间的基，hi，c代表Fc在子空间的对应位置，矩阵Gc代表第c类训练数据的类内子空间的基，wi，j，c代表Gc在子空间的对应位置，εi，j，c代表第c类训练数据的残留噪声；识别阶段包括：对待识别数据提取特征并进行分类判决得到特征空间上的多类待识别集；针对每类待识别集进行局部学习，根据训练数据得到的多个模型计算每类待识别集的后验概率作为结果。

专利专题