一种噪声条件下的语音检测方法
本发明提供的是一种噪声条件下的语音检测方法。属于数字信号处理、计算机人工智能及模式识别技术领域。本发明将输入信号变换到频域,然后划成子带。再求各子带功率谱形成子带功率谱。求各帧的子带功率谱的均方差,以此作为检测特征与自适应的语音检测阈值进行比较,以确当前帧是否含有语音信号。根据检测结果,采用一定的端点确定策略,确定语音段的起始位置和结束位置。
发明专利
CN201010523408.9
2010-10-28
CN101968957A
2011-02-09
G10L11/02(2006.01)I
哈尔滨工程大学
刘冠群;张汝波;李雪耀;徐东;杨歌;史长亭;刘佰龙;张子迎;尹清波;林俊宇
150001 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室
黑龙江;23
一种噪声条件下的语音检测方法,其特征是:1)将输入信号分帧,进行离散傅立叶变换,变换到频域,然后将整个频域,划分为多个等带宽的子带;2)计算每帧信号的子带功率谱;3)如果处于初始噪声估计和初始语音检测阈值估计阶段,则进行初始噪声估计和初始检测阈值处理,转到步骤1),否则转步骤4);4)减去每个子带内的噪声能量,获得去噪后的子带功率谱;5)计算每帧信号内各子带的功率谱的均方差;6)将每帧信号的子带功率谱均方差与自适应检测阈值进行比较;7)如果大于自适应检测阈值,则把当前帧判为候选语音帧,否则判为候选非语音帧;8)根据步骤7)的检测结果,如果还没有确定语音段的起始位置,则应用适当策略进行精确的语音段的起始点和结束点定位;9)根据步骤8)的结果,则对噪声估计和语音检测阈值进行更新;10)重复步骤1)?9),直至检测结束。