远距离语音识别中的模型域补偿新方法
本发明涉及语音识别技术领域,公开了一种远距离语音识别中去混响方法及系统。该方法包括:模拟室内的声学环境,通过输入的室内空间尺寸,生成不同位置的房间冲击响应序列;对生成的房间冲击响应序列做聚类分析,从而将室内声学环境划分为多个区域,求出每一个区域冲击响应序列的相应补偿矩阵;在构建的识别网络中,用各个区域的补偿矩阵对识别网络进行按帧的补偿,从多个识别结果中利用最大后验概率思想,求出最佳补偿。本发明通过对声学空间进行聚类分析,做到对识别网络有区别性的模型补偿,极大的提高了室内环境中远距离语音识别的抗混响性能。
发明专利
CN201310201102.5
2013-05-27
CN103258533A
2013-08-21
G10L15/20(2006.01)I
重庆邮电大学
杨勇;李劲松
400065 重庆市南岸区黄桷垭崇文路2号
重庆华科专利事务所 50123
康海燕
重庆;85
远距离语音识别中的模型域补偿方法, 其特征在于:包括步骤:应用镜像算法计算多组不同位置的房间冲击响应序列,对房间冲击响应序列进行优化,按帧提取能量参数;利用K均值聚类算法对优化后的房间冲击响应序列进行聚类,求出房间冲击响应类的混响模型,对每个混响模型应用广义逆矩阵求出均值辅助补偿矩阵和方差辅助补偿矩阵;利用清晰语音语料库训练清晰语音的隐马尔科夫模型;利用得到的辅助补偿矩阵参数,在维特比解码阶段对语音模型参数执行按帧补偿算法,按最大后验概率原则选择最佳的辅助补偿矩阵参数。