10.3969/j.issn.1000-3428.2012.23.044
发音特征在维汉语音识别中的应用
采用传统谱特征作为输入进行语音识别通常会受到声学环境差异的影响.为此,提出汉语和维语音素和音位的对应规则,并将这种规则应用于基于发音特征的语音识别系统.训练神经网络多层感知器,获取语音信号各类发音特征的后验概率,将其与美尔频率倒谱系数(MFCC)拼接后送入隐马尔科夫模型进行声学模型训练.将不同发音特征分别与传统MFCC特征进行组合并给出测试结果.实验结果表明,当汉语声带状况和送气发音特征与传统MFCC组合时,以及维语的发音方式和声带状况特征与MFCC组合之后,系统误识率较低.
维汉语音识别、多层感知器、声学模型、美尔频率倒谱系数、特征组合
38
TP391(计算技术、计算机技术)
国家自然科学基金资助项目60965002;新疆高校科研计划培育基金资助项目XJEDU2008S15;新疆大学博士科研启动基金资助项目BS090143
2013-01-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
177-180