基于REMOS的远距离语音识别模型补偿方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3979/j.issn.1673-825X.2014.01.020

基于REMOS的远距离语音识别模型补偿方法

引用
封闭环境中远距离语音识别会受到混响效果的影响,从而降低语音识别率.混响建模(reverberation modeling for speech recognition,REMOS)是一种在模型域进行混响补偿的新方法,该方法在已知声源位置的情况下能有效提升远距离语音识别精度.但在实际应用中,往往难以预测声源的位置.利用最大后验概率的原理,基于对房间不同区域进行有区别补偿的思想,在按帧的隐马尔可夫模型(hidden Markov model,HMM)补偿的基础上,提出一种在封闭环境中新的模型补偿方法.该方法利用K均值聚类K-means算法对房间冲击响应(room impulse response,RIR)的优化集进行聚类,对所属相同类的混响模型进行合并处理,再把合并后的混响模型载入维特比算法中,对清晰语音的HMM模型进行按帧补偿.最后采用后验概率方法选择最佳补偿,使得模型域的混响补偿能最接近精确补偿.实验证明,该方法能进一步提升远距离语音识别的精度.

混响、混响建模(REMOS)、K-means、房间冲击响应、模型补偿

26

TP391.4(计算技术、计算机技术)

重庆市自然科学基金CSTC 2007BB2445;重庆市教委科学技术研究项目KJ110522;重庆邮电大学科研基金A2009-26;The Natural Science Foundation Project of CQ CSTCCSTC 2007BB2445;The Science & Technology Research Project of Chongqing Education Committee of ChinaKJ110522;The Scientific Fund Project of Chongqing University of Posts and TelecommunicationsA2009-26

2016-01-16(万方平台首次上网日期,不代表论文的发表时间)

共8页

117-123,130

相关文献
评论
暂无封面信息
查看本期封面目录

重庆邮电大学学报(自然科学版)

1673-825X

50-1181/N

26

2014,26(1)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn