10.3321/j.issn:0469-5097.2003.04.011
混响声场中语音识别方法研究
免提式话筒语音识别系统是语音识别走向实用的目标之一.实现这一系统,首先要解决房间效应引起的混响问题.通过讨论室内混响声场中语音的特点,提出用鲁棒性特征参数--滤波规整的Mel频率倒谱参数(FNMFCC),即MFCC参数在对数功率谱域进行低通滤波,倒谱域进行均值减,并用标准差加权进行非线性规整,采用这3种措施来消除混响引起的语音参数的变化.识别方法用矢量量化法,用4组无混响数码语音进行训练,对特定人无混响和4种混响声场中共150组数码音的平均识别率达到98.7%.提出的这一新方法在不降低无混响音识别率的情况下,提高了混响声场的语音识别率.该方法不仅识别率高,而且运算量小、所需内存空间小,易于做成小型实用的快速识别系统.
混响声场、语音识别、滤波规整的Mel频率倒谱参数、矢量量化
39
TN912.34
国家自然科学基金资助项目60272037
2008-05-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
525-531