基于后验知识监督的噪声鲁棒声学模型研究

引用

摘要：

语音人机交互技术作为近几年的一个研究热点,市场需求逐步增长,但是人机交互系统在抗干扰能力上存在不足,系统性能易受环境噪声的影响,一定程度上限制了相关产品的应用推广.针对人机交互噪声鲁棒性问题,提出了一种基于后验知识监督的噪声鲁棒声学建模方法,类似于老师指导学生的方式,以老师模型的后验概率分布(软标注)作为指导知识对学生模型的训练进行监督,并设计出一种基于CNN-DNN混合网络的学生模型,通过对带噪语音的高层特征进行提炼,提升声学模型的抗噪性能.构建的学生模型在CHIME带噪数据集下进行了性能验证实验,实验结果显示三种老师模型监督下的学生模型词错误率与基线模型相比平均下降了5.21％、6.35％和7.83％,表明提出的后验知识监督方法对声学模型的鲁棒性具有很好的提升效果.

关键词：噪声鲁棒性、声学模型、后验知识监督、CNN-DNN混合模型

所属期刊栏目：40

分类号：O152.1(代数、数论、组合理论)

资助基金：国网总部科技项目5268001600SV

在线出版日期：2019-04-09（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：98-103

英文信息展示

期刊专题