DOI：10.3969/j.issn.1004-9037.2009.01.001

基于三音素动态贝叶斯网络模型的大词汇量连续语音识别

引用

摘要：

考虑连续语音中的协同发音现象,基于词-音素结构的DBN(WP-DBN)模型和词-音素-状态结构的DBN(WPS-DBN)模型,引入上下文相关的三音素单元,提出两个新颖的单流DBN模型:基于词-三音素结构的DBN(WT-DBN)模型和基于词-三音素-状态的DBN(WTS-DBN)模型.WTS-DBN模型是三音素模型,识别基元为三音素,以显式的方式模拟了基于三音素状态捆绑的隐马尔可夫模型(HMM).大词汇量语音识别实验结果表明:在纯净语音环境下,WTS-DBN模型的识别率比HMM,WT-DBN,WP-DBN和WPS-DBN模型的识别率分别提高了20.53%,40.77%,42.72%和7.52%.

关键词：语音识别、动态贝叶斯网络、三音素、音素

所属期刊栏目：24

分类号：TP391.42(计算技术、计算机技术)

资助基金：中国博士后基金20080431251;国家"八六三"高技术研究发展计划2007AA01Z324

在线出版日期：2009-04-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：1-6

英文信息展示

期刊专题