复杂背景噪声中的语音激活检测方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方专利
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

专利专题

复杂背景噪声中的语音激活检测方法

引用
本发明公开了一种复杂背景噪声中的语音激活检测方法,依次包括以下步骤:1)首先对数据进行TEO运算;2)对输入数据x(n)进行预加重;3)带通滤波;4)分帧加窗处理;5)计算每帧的自相关及其标准方差的开方值;6)计算初始阶段20帧的Stati及其均值mean(Stati)和标准方差std(Stati),将std(Stati)与预置门限比较,判断有无语音;7)计算后续数据;8)计算连续FrameN帧的Stati,根据其均值mean(Stati)和标准方差std(Stati),进行二次判决;9)考虑语音间隔及持续时间Speechmin=100~200ms,Silencemin=500~1000ms,在Statusfinal=0条件下,当出现连续Ns(该值与FrameN相关)个atatus=1时,判断语音出现;在Statusfinal=1条件下,当出现连续NE(该值同样与FrameN相关)个Status=0时,判断语音结束,最终判断语音的真正端点。

发明专利

CN201110093186.6

2011-04-14

CN102194452A

2011-09-21

G10L11/02(2006.01)I

西安烽火电子科技有限责任公司

梁峰;张凡;曹军勤;杨勇

710075 陕西省西安市高新区高新六路28号三层

陕西;61

一种复杂背景噪声中的语音激活检测方法,其特征在于,依次包括以下步骤:1)、首先对数据进行TEO运算:TEO[x(n)]=x(n)2?x(n+1)x(n?1);2)、对输入数据x(n)进行预加重,其传递函数为:H(z)=1?μz?1,μ∈[0.92,0.96],x(n)=filter([1?μ],1,x(n));3)、带通滤波:采用带通滤波,除去无用信号:x(n)=band_pass_filter(x(n))4)、分帧加窗处理:帧长20ms,帧间重叠20%~40%。窗函数一般采用Hamming窗:xn(N)=xn(N).*Hamming(N);5)、计算每帧的自相关及其标准方差的开方值:Stat=k*sqrt(std(xcorr(xn(N)))),k为系数,它与判决门限取值相关;6)、计算初始阶段20帧的Stati及其均值mean(Stati)和标准方差std(Stati),将std(Stati)与预置门限比较,判断有无语音;判断根据:如果初始阶段无语音,则std(Stati)较小,否则std(Stati)较大;如初始阶段无语音,则计算该阶段的参考门限,作为后续数据的判决门限:Thref=mean(Stat(1:20))+m*std(Stat(1:20));7)、计算后续数据,每帧判决一下:8)、计算连续FrameN帧的Stati,根据其均值mean(Stati)和标准方差std(Stati),进行二次判决:或者采用多数判决原则次判断:如8帧中超过5帧出现Statustemp=1,则判断Status=1,出现语音;9)、考虑语音间隔及持续时间Speechmin=100~200ms,Silencemin=500~1000ms,在Statusfinal=0条件下,当出现连续NS(该值与FrameN相关)个Status=1时,判断语音出现;在Statusfinal=1条件下,当出现连续NE(该值同样与FrameN相关)个Status=0时,判断语音结束,最终判断语音的真正端点。FSA00000473371100011.tif,FSA00000473371100012.tif,FSA00000473371100013.tif
相关文献
评论
法律状态详情>>
2013-10-23授权
2011-09-21公开
2011-11-23实质审查的生效
相关作者
相关机构