10.3969/j.issn.1002-8684.2011.10.012
基于MLER和GMM的语音音乐分类
研究了音频信息处理中一项重要的预处理工作:语音音乐分类.针对语音信号处理中遇到的实际问题,选择合适的音频特征和分类器来对音频数据进行语音和音乐分类.采用二级系统,选择优化低能量率( Modified Low Energy Ratio,MLER)以及梅尔频谱倒谱系数(Mel Frequency Cepstral Coefficients,MFCC)作为音频特征,通过贝叶斯分类和混合高斯分类器进行分类.最后,使用上下文分类器对分类结果进行修正.实验结果表明,这种分类方法准确率和速度都较好.
二级系统、优化低能量率、梅尔频谱倒谱系数、混合高斯分类器、上下文分类器
35
TN912.16
国家自然科学基金委员会与香港研究资助局联合科研基金资助项目60931160443;国家自然科学基金项目90920302,61005019;国家高技术研究发展计划863计划项目2008AA040201
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
47-50