10.3969/j.issn.1001-0505.2015.05.001
面向语音情感识别的语谱图特征提取算法
为研究信号相关性在语音情感识别中的作用,提出了一种面向语音情感识别的语谱图特征提取算法。首先,对语谱图进行处理,得到归一化后的语谱图灰度图像;然后,计算不同尺度、不同方向的 Gabor 图谱,并采用局部二值模式提取 Gabor 图谱的纹理特征;最后,将不同尺度、不同方向 Gabor 图谱提取到的局部二值模式特征进行级联,作为一种新的语音情感特征进行情感识别。柏林库(EMO-DB)及 FAU AiBo 库上的实验结果表明:与已有的韵律、频域、音质特征相比,所提特征的识别率提升3%以上;与声学特征融合后,所提特征的识别率较早期声学特征至少提高5%。因此,利用这种新的语音情感特征可以有效识别不同种类的情感语音。
情感识别、语谱图、图像纹理特征、局部二值模式
TP391.42(计算技术、计算机技术)
国家自然科学基金资助项目61231002,61273266,61301219;教育部博士点专项基金资助项目20110092130004;江苏省自然科学基金资助项目BK20130241.
2015-10-20(万方平台首次上网日期,不代表论文的发表时间)
共5页
817-821