DOI：10.3969/j.issn.1000-1220.2005.11.038

音频自动分类中的特征分析和抽取

引用

摘要：

音频特征分析和抽取是音频自动分类的基础,本文将音频对象分为静音,噪音,纯语音,带背景音语音,音乐等5类,从帧层次和段层次上深入分析了不同类音频之间的区别性特征,包括帧层次上的MFCC,频域能量,子带能量,过零率,频谱中心等特征,在此基础上计算了段层次上的基本音频特征,包括静音比率,子带能量比均值等,提出了3个音频"流"特征-High-ZCR比率,Low-Frequency-Energy比率,频谱流量.设计并实现了一种基于支持向量机(support vector machine)的自动分类器,考察了上述特征组成的特征集合在该分类器中的分类性能.实验表明,本文提出的特征有效,分类性能良好.

关键词：特征分析和抽取、基于内容的音频分类、支持向量机

所属期刊栏目：26

分类号：TP316(计算技术、计算机技术)

资助基金：教育部新世纪优秀人才支持计划

在线出版日期：2005-12-01（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：2029-2034

英文信息展示

期刊专题