基于长时信号功率谱变化的语音端点检测
语音端点检测是语音信号处理的基础,为了提高在低信噪比及非平稳噪声下语音端点检测的准确性,提出了一种基于长时信号功率谱变化的语音特征,利用阈值判决法验证了这一特征在语音端点检测中的应用前景.该方法首先统计信号在长时段下功率谱的变化量;然后进行阈值判决,在初始化后可依据每次的判决结果自适应更新阈值;最后通过投票决策机制来判定当前是否为语音帧.仿真结果表明,与两种经典的基于长时特征(长时段信号变化率和长时段信号谱平坦度)的语音端点检测方法相比,所提方法在不同噪声环境及信噪比下,均具有更高的检测准确率,尤其在非平稳噪声条件下的检测效果提升明显,例如在机枪噪声环境下,平均检测准确率提高超过10%.
语音端点检测、长时信号频谱变化、低信噪比、非平稳噪声
13
TP391(计算技术、计算机技术)
The Science and Technology Support Program of Tianjin under Grant No. 16YFZCGX00760
2019-09-24(万方平台首次上网日期,不代表论文的发表时间)
共9页
1534-1542