基于无限状态隐马尔可夫模型的与文本相关的说话人识别方法

引用

摘要：

本发明公开了一种基于无限状态隐马尔可夫模型的与文本相关的说话人识别方法，利用本方法可以避免传统的隐马尔可夫模型容易出现的过拟合或欠拟合数据的问题。本发明首先对用于训练的语音信号集合进行预处理和特征提取，接着在训练过程中采用了无限状态隐马尔可夫模型来描述训练集合，该模型在训练数据到来之前具有无限状态数目，并且每个状态所对应的输出概率分布函数用学生氏t混合模型来表示，在训练数据到来之后，通过计算得到该模型中的参数值和随机变量的分布情况；在识别时，将经过预处理和特征提取的带识别的语音，计算其关于训练好的每一说话人模型的似然值，将最大的似然值对应的说话人作为识别结果。本发明的方法可以有效地提高与文本相关的说话人识别系统的识别正确率，此外系统对噪声也具有较好的鲁棒性。

专利类型：发明专利

申请/专利号：CN201110085844.7

申请日期：2011-04-07

公开/公告号：CN102129860A

公开/公告日：2011-07-20

主分类号：G10L17/00(2006.01)I

申请/专利权人:魏昕

发明/设计人:魏昕

主申请人地址:210096 江苏省南京市四牌楼2号东南大学信息科学与工程学院

国别省市代码:江苏;32

专利专题