10.3969/j.issn.2095-2163.2011.04.008
基于长短时能量均值的活动语音检测算法
为了有效抑制非平稳背景噪音对语音处理系统的严重干扰,提出了一种基于长短时能量均值的活动语音检测算法.该算法基于两个合理的假设,一个是基于语音隐含成分集的稀疏分解,不但能尽可能地保留含噪语音中的语音信息,还能在一定程度上消除非语音类噪音的干扰;另一个是对上述稀疏分解的语音进行重构,该重构信号中语音段的时域能量高于非语音段的时域能量.在上述两个假设的基础上,采用重构信号的时域能量作为音频特征,以当前帧为中心,并将与其相邻的特定数量帧的短时能量均值作为当前帧的得分值;以当前帧及其之前特定数量帧的长时能量均值作为判决阈值,进而提出了以当前帧的短时能量均值和长时能量均值大小作为判断条件的活动语音检测算法.实验结果显示,该算法能有效地区分低信噪比(平稳噪音和非平稳噪音)条件下的语音和非语音片段,并且其性能优于基于单Gaussian分布的似然比算法.
语音隐含成分、稀疏分解、能量均值、活动语音检测
1
TP39(计算技术、计算机技术)
国家973基金项目2007CB311100
2012-03-05(万方平台首次上网日期,不代表论文的发表时间)
共5页
35-39