一种噪声条件下的语音检测方法

引用

摘要：

本发明提供的是一种噪声条件下的语音检测方法。属于数字信号处理、计算机人工智能及模式识别技术领域。本发明将输入信号变换到频域，然后划成子带。再求各子带功率谱形成子带功率谱。求各帧的子带功率谱的均方差，以此作为检测特征与自适应的语音检测阈值进行比较，以确当前帧是否含有语音信号。根据检测结果，采用一定的端点确定策略，确定语音段的起始位置和结束位置。

专利类型：发明专利

申请/专利号：CN201010523408.9

申请日期：2010-10-28

公开/公告号：CN101968957A

公开/公告日：2011-02-09

主分类号：G10L11/02(2006.01)I

申请/专利权人:哈尔滨工程大学

发明/设计人:刘冠群;张汝波;李雪耀;徐东;杨歌;史长亭;刘佰龙;张子迎;尹清波;林俊宇

主申请人地址:150001 黑龙江省哈尔滨市南岗区南通大街145号哈尔滨工程大学科技处知识产权办公室

国别省市代码:黑龙江;23

权利要求：

一种噪声条件下的语音检测方法，其特征是：1)将输入信号分帧，进行离散傅立叶变换，变换到频域，然后将整个频域，划分为多个等带宽的子带；2)计算每帧信号的子带功率谱；3)如果处于初始噪声估计和初始语音检测阈值估计阶段，则进行初始噪声估计和初始检测阈值处理，转到步骤1)，否则转步骤4)；4)减去每个子带内的噪声能量，获得去噪后的子带功率谱；5)计算每帧信号内各子带的功率谱的均方差；6)将每帧信号的子带功率谱均方差与自适应检测阈值进行比较；7)如果大于自适应检测阈值，则把当前帧判为候选语音帧，否则判为候选非语音帧；8)根据步骤7)的检测结果，如果还没有确定语音段的起始位置，则应用适当策略进行精确的语音段的起始点和结束点定位；9)根据步骤8)的结果，则对噪声估计和语音检测阈值进行更新；10)重复步骤1)?9)，直至检测结束。

专利专题