一种基于共有鉴别性子空间映射的语种识别方法及装置

引用

摘要：

本发明涉及一种基于共有鉴别性子空间映射的语种识别方法及装置，该方法包括：提取一个语种的多个语音数据的语音特征；根据所述语音特征得到所述多个语音数据的高斯超向量，其中，每个语音数据对应一组高斯超向量；将所述高斯超向量映射到共有鉴别性子空间，得到与所述高斯超向量对应的低维向量，其中，所述共有鉴别性子空间是预先用多个语种的语音数据建立的；以及分别计算所述低维向量在多个支持向量机SVM模型上的得分，根据多个得分识别出所述语种，其中，所述多个SVM模型是预先根据所述共有鉴别性子空间训练出来的，每个SVM模型对应一个语种。相比于直接对高斯超向量进行建模，本发明的语种识别方法由于其低维和鉴别性，训练速度更快，识别性能有了明显提高。

专利类型：发明专利

申请/专利号：CN201210587263.8

申请日期：2012-12-28

公开/公告号：CN103077709A

公开/公告日：2013-05-01

主分类号：G10L15/14(2006.01)I

申请/专利权人:中国科学院声学研究所%北京中科信利技术有限公司

发明/设计人:周若华;颜永红;王宪亮;刘建

主申请人地址:100190 北京市海淀区北四环西路21号

专利代理机构:北京亿腾知识产权代理事务所 11309

代理人:陈霁

国别省市代码:北京;11

权利要求：

一种基于共有鉴别性子空间映射的语种识别方法，包括：提取一个语种的多个语音数据的语音特征；根据所述语音特征得到所述多个语音数据的高斯超向量，其中，每个语音数据对应一组高斯超向量；将所述高斯超向量映射到共有鉴别性子空间，得到与所述高斯超向量对应的低维向量，其中，所述共有鉴别性子空间是预先用多个语种的语音数据建立的；以及分别计算所述低维向量在多个支持向量机SVM模型上的得分，根据多个得分识别出所述语种，其中，所述多个SVM模型是预先根据所述共有鉴别性子空间训练出来的，每个SVM模型对应一个语种。

专利专题