DOI：10.3969/j.issn.1006-9348.2015.12.069

基于人耳听觉特性的语音识别预处理研究

引用

摘要：

在人耳听觉语音识别优化过程中,由于在噪声环境下传统语音识别预处理过程不能得到高信噪比的语音信号,使识别率下降.为此结合人耳听觉特性,提出一种基于入耳的听觉选择能力即“鸡尾酒会效应”的语音分离技术应用到语音识别预处理过程.含噪声的语音信号经过耳蜗基底膜模型进行频谱分析,再通过上橄榄核模型进行语音信息提取,最后在下丘脑细胞模型中完成语音分离.分离得到更纯净的语音后,对语音信号提取梅尔频率倒谱(MFCC)参数,并建立隐马尔可夫(HMM)声学模型来验证语音识别效果,实验结果表明:在噪声环境下,相比于传统抗噪方法,改进方法具有更好的抗噪效果,表明上述语音识别系统具有更好的鲁棒性.

关键词：语音识别、人耳听觉特性、语音分离、预处理

所属期刊栏目：32

分类号：TP242.63(自动化技术及设备)

资助基金：国家科技部国际合作项目2010DFA12160;重庆市科技攻关项目GSTC:2010AA2055;重庆市科研项目KJ13051

在线出版日期：2016-03-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：322-326

英文信息展示

期刊专题