10.15918/j.tbit1001-0645.2016.03.014
2D-Haar声学特征超向量快速生成方法
针对大数据量音频的高速处理,提出一种快速的声学特征超向量生成方法,有效提高音频识别系统的识别速度和精度.所提方法首先将多个连续音频帧的常用声学特征构成声学特征图,进而使用低复杂度的运算方法在其中快速提取维数达数十万的Haar-like声学特征;然后使用AdaBoost.MH算法,筛选出具有较高代表性的Haar-like声学特征模式组合,用以构成声学特征超向量;进而提出Random AdaBoost特征筛选方法,进一步提高特征筛选速度.实验结果表明,在音频事件识别、说话人识别、说话人性别识别3种场合下,使用Haar-like声学特征可以使SVM、C5.0、AdaBoost等识别算法获得比MFCC、PLP、LPCC等常用声学特征更高的识别准确率,同时可以获得7~20倍的训练速度提升和5~10倍的识别速度提升.
音频处理、音频识别、2D-Haar声学特征超向量、Haar-like声学特征、AdaBoost.MH
36
TP391(计算技术、计算机技术)
国家“二四二”计划项目2005C48;北京理工大学科技创新计划项目2011CX01015
2016-08-05(万方平台首次上网日期,不代表论文的发表时间)
295-301