DOI：10.11992/tis.202103005

面向数据增强的多种语音情感分类算法研究

引用

摘要：

目前语音情感识别存在语音样本不足、提取的特征数据量大和无关特征多使得识别率不高的问题.针对语音样本不足的情况,在预处理阶段提出了时频域的数据增强方法,对原有的数据库进行扩充;根据传统算法中提取的特征数据量大且与情感无关的特征多的现状,提取了1582维的情感特征和10组低级描述特征.分别在支持向量机、随机森林和K最邻近3种机器学习算法上做了对比实验.实验证明:支持向量机的平均识别率比较好.在所提取的10组特征组中,LogMelFreqBand特征在3种算法上的精确度分别为74.63％、64.93％和66.42％;而pcm_fftMag_mfcc特征的精确度分别为84.33％、73.13％和58.21％.

关键词：语音情感识别、数据增强、情感特征、支持向量机、随机森林、K最邻近、低级描述特征、机器学习

所属期刊栏目：16

分类号：TP181(自动化基础理论)

资助基金：国家自然科学基金;国家自然科学基金;德岛大学研究集群项目

在线出版日期：2021-06-15（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：170-177

英文信息展示

期刊专题