10.15918/j.tbit1001-0645.2015.11.016
基于功率谱包络动态分割的鲁棒语音端点检测
在复杂的声学环境中,由于环境噪声的干扰,导致声学特征的稳定性不够理想.为克服此难题,通常对决策结果在时间维度上进行平滑.然而,这些平滑过程本身没有考虑数据在时间维度上的结构特征,属于启发式的方法.该文采用动态分割的方法,将语音的频谱包络在时间维度上分割成具有特征同一性的时间块,以分割块为单位计算能量特征,并进行语音/非语音决策,从而达到提高语音端点检测的稳定性目的.实验表明,提出的方法有效提高了语音端点检测的鲁棒性.
语音端点检测、动态分割、聚类、最小描述长度准则
35
TN912.3
国家重点基础研究发展计划项目资助2013CB32930;国家自然科学基金资助项目61271426,10925419,90920302,61072124,11074275,11161140319,91120001;中国科学院战略性先导科技专项基金资助项目XDA06030100,XDA06030500;国家"八六三"计划项目2012AA012503;中科院重点部署资助项目KGZD-EW-103-2;江西理工大学科研基金资助项目NSFJ2015-G21
2016-03-07(万方平台首次上网日期,不代表论文的发表时间)
1189-1193