自由表述口语语音评测后验概率估计改进方法

引用

摘要：

该文研究了两种用于改善深度神经网络声学建模框架下自由表述口语语音评测任务后验概率估计的方法:1)使用RNN语言模型对一遍解码N-best候选做语言模型得分重估计来获得更准确的识别结果以重新估计后验概率;2)借鉴多语种神经网络训练框架,提出将方言数据聚类状态加入解码神经网络输出节点,在后验概率估计中引入方言似然度得分以评估方言程度的新方法.实验表明,这两种方法估计出的后验概率与人工分相关度分别绝对提升了3.5％和1.0％,两种方法融合后相关度绝对提升4.9％;对于一个真实的评测任务,结合该文改进的后验概率评分特征,总体评分相关度绝对提升2.2％.

关键词：自由表述口语、语音评测、后验概率、深度神经网络、RNN语言模型

所属期刊栏目：31

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金61273264

在线出版日期：2017-06-20（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：212-219

英文信息展示

期刊专题