一种说话人识别方法及系统

引用

摘要：

本发明涉及一种说话人识别方法，所述方法包括：通过训练得到邻域保持嵌入空间矩阵；基于所述邻域保持嵌入空间矩阵进行说话人识别；所述基于所述邻域保持嵌入空间矩阵进行说话人识别，包括：对于每一个高斯混合模型GMM均值超向量x进行主成分分析PCA降维得到向量w；使用所述邻域保持嵌入空间矩阵对于每一个所述向量w进行映射得到向量w’；将经过映射得到的所述向量w’作为支持向量机SVM的输入特征进行后端分类建模；借助支持向量机SVM打分，根据打分结果识别说话人。本发明实施例采用一种新型的基于邻域保持嵌入NPE的因子分析技术，能够有效地克服现有总变化因子分析技术存在的不足，进一步提高说话人识别性能。

专利类型：发明专利

申请/专利号：CN201210555152.9

申请日期：2012-12-19

公开/公告号：CN103077720A

公开/公告日：2013-05-01

主分类号：G10L17/12(2013.01)I

申请/专利权人:中国科学院声学研究所%北京中科信利技术有限公司

发明/设计人:周若华;颜永红;梁春燕;杨琳

主申请人地址:100190 北京市海淀区北四环西路21号

专利代理机构:北京亿腾知识产权代理事务所 11309

代理人:陈霁

国别省市代码:北京;11

权利要求：

一种说话人识别方法，其特征在于，所述方法包括：通过训练得到邻域保持嵌入空间矩阵；基于所述邻域保持嵌入空间矩阵进行说话人识别；所述基于所述邻域保持嵌入空间矩阵进行说话人识别，包括：对于每一个高斯混合模型GMM均值超向量x进行主成分分析PCA降维得到向量w；使用所述邻域保持嵌入空间矩阵对于每一个所述向量w进行映射得到向量w’；将经过映射得到的所述向量w’作为支持向量机SVM的输入特征进行后端分类建模；借助支持向量机SVM打分，根据打分结果识别说话人。

专利专题