多个声源下基于人耳听觉特性的语音分离

引用

摘要：

受声学研究启发,结合人脑人耳听觉特性对语音的处理方式,建立了一个完整的模拟听觉中枢系统的语音分离模型.首先利用外周听觉模型对语音信号进行多频谱分析,然后建立重合神经元模型提取语音信号的特征,最后在脑下丘的神经细胞模型中完成对语音的分离.基于现有的语音识别方法,该模型能够很好地解决绝大多数的语音识别方法都只能在单声源和低噪声的环境下使用的问题.实验结果表明,该模型能够实现多声源环境下语音的分离并且具有较高的鲁棒性.随着研究的深入,基于人耳听觉特性的语音分离模型将有很广泛的应用前景.

关键词：多声源、人耳听觉特性、双耳时间差、双耳水平差、语音分离

所属期刊栏目：7

分类号：TP311(计算技术、计算机技术)

资助基金：科技部国际合作资助项目2010DF12160;重庆市攻关计划资助项目CSTC:2010AA2055

在线出版日期：2012-08-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：121-128

英文信息展示

期刊专题