DOI：10.3969/j.issn.1000-7024.2012.04.044

基于语音结构化模型的数字语音识别

引用

摘要：

提出一种新的基于语音结构化模型的语音识别方法,并应用于非特定人数字语音识别.每一个数字语音计算倒谱特征之后提取语音中存在的对说话人差异具有不变性的结构化特征——全局声学结构(acoustical universal structure,AUS),并建立结构化模型,识别时提取测试语音的全局声学结构,然后与各数字语音的结构化模型进行匹配.测试了少量语料训练下的识别性能并与传统HMM (hidden Markov model)方法进行比较,结果表明该方法可以取得优于HMM的性能,语音结构化模型可以有效消除说话人之间的差异.

关键词：语音结构化模型、数字识别、隐马尔可夫模型、说话人差异、巴氏距离

所属期刊栏目：33

分类号：TN912.34

资助基金：北京市“现代信息科学与网络技术”重点实验室暨铁道部“铁道信息科学与工程”开放实验室开放基金项目XDXX1006

在线出版日期：2012-06-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：1482-1485,1490

英文信息展示

期刊专题