一种基于互补声学模型的多系统融合语音关键词检测方法
采用一种基于互补声学模型的多系统融合方法来获得高性能的语音关键词检测系统:1)在基线系统的基础上,使用不同的音素集进行声学建模,并引入基于神经网络的声学建模方法,获得另外两套具有建模差异性的声学系统;2)在多套关键词检测系统的基础上,通过选择有效的系统融合准则,将多个系统的输出进行整合,获得更好的语音关键词检测结果.该方法充分利用了差异性声学建模系统之间的互补性,在不增加训练数据的情况下,显著地提升了最终系统的性能.和基线系统相比,该方法在2005年国家863电话语音关键词检测技术评测集上,存等错误率(Equal error rate,EER)指标下,获得相对21.6%的显著性能提升.
关键词检测、高斯混合模型、神经网络
35
TP391.4(计算技术、计算机技术)
国家高技术研究发展计划863计划2006AA010103;中国科学院自动化研究所青年科技创新基金项目07J1041CZ1
2009-03-13(万方平台首次上网日期,不代表论文的发表时间)
共7页
39-45