10.3969/j.issn.1000-1220.2005.11.038
音频自动分类中的特征分析和抽取
音频特征分析和抽取是音频自动分类的基础,本文将音频对象分为静音,噪音,纯语音,带背景音语音,音乐等5类,从帧层次和段层次上深入分析了不同类音频之间的区别性特征,包括帧层次上的MFCC,频域能量,子带能量,过零率,频谱中心等特征,在此基础上计算了段层次上的基本音频特征,包括静音比率,子带能量比均值等,提出了3个音频"流"特征-High-ZCR比率,Low-Frequency-Energy比率,频谱流量.设计并实现了一种基于支持向量机(support vector machine)的自动分类器,考察了上述特征组成的特征集合在该分类器中的分类性能.实验表明,本文提出的特征有效,分类性能良好.
特征分析和抽取、基于内容的音频分类、支持向量机
26
TP316(计算技术、计算机技术)
教育部新世纪优秀人才支持计划
2005-12-01(万方平台首次上网日期,不代表论文的发表时间)
共6页
2029-2034