10.3969/j.issn.1004-9037.2009.01.001
基于三音素动态贝叶斯网络模型的大词汇量连续语音识别
考虑连续语音中的协同发音现象,基于词-音素结构的DBN(WP-DBN)模型和词-音素-状态结构的DBN(WPS-DBN)模型,引入上下文相关的三音素单元,提出两个新颖的单流DBN模型:基于词-三音素结构的DBN(WT-DBN)模型和基于词-三音素-状态的DBN(WTS-DBN)模型.WTS-DBN模型是三音素模型,识别基元为三音素,以显式的方式模拟了基于三音素状态捆绑的隐马尔可夫模型(HMM).大词汇量语音识别实验结果表明:在纯净语音环境下,WTS-DBN模型的识别率比HMM,WT-DBN,WP-DBN和WPS-DBN模型的识别率分别提高了20.53%,40.77%,42.72%和7.52%.
语音识别、动态贝叶斯网络、三音素、音素
24
TP391.42(计算技术、计算机技术)
中国博士后基金20080431251;国家"八六三"高技术研究发展计划2007AA01Z324
2009-04-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
1-6