10.15918/j.tbit1001-0645.2015.09.013
鉴别性最大后验概率线性回归说话人自适应研究
为增强自适应后的声学模型的鉴别能力,提出了一种基于最大互信息(MMI)的鉴别性最大后验概率线性回归(MMI-DMAPLR)说话人自适应方法.将最大互信息准则和最大后验概率(MAP)准则相结合,设计了一个新的目标函数来估计基于线性变换的自适应方法中的变换参数,在最大后验概率估计中加入了鉴别性.大词汇量连续语音识别的实验结果表明,新方法在增强声学模型与测试数据的匹配性的同时,可以有效提高声学模型的鉴别能力,在少量自适应数据的情况下,其性能比最大后验概率线性回归(MAPLR)相对提高4.8%.
最大似然线性回归、最大后验概率线性回归、最大互信息、说话人自适应
35
TN912.3
国家自然科学基金资助项目10925419,90920302,61072124,11074275,11161140319,91120001,61271426;中国科学院战略性先导科技专项XDA06030100,XDA06030500;国家“八六三”计划项目2012AA012503;中科院重点部署项目KGZD-EW-103-2
2015-12-16(万方平台首次上网日期,不代表论文的发表时间)
946-950