基于PNCC与基频的鲁棒电话语音性别检测方案
针对电话语音性别检测存在识别准确率较低的问题,提出了一种有效的电话语音性别检测方案(CNN+SVM);首先,采用卷积神经网络(Convolutional Neural Network,CNN)提取幂律归一化倒谱系数(Power-Normalized Cepstral Coefficient,PNCC)的有效信息;然后,结合优化后的基频特征,选用支持向量机(Support Vector Machine,SVM)实现性别分类.该方案有效融合了男、女发音和听觉感知特性上的差异,同时利用了CNN特征提取能力以及SVM鲁棒分类能力.仿真结果表明:CNN+SVM方案针对实际场景电话语音数据集的性别识别准确率优于传统识别方法.
幂律归一化倒谱系数、卷积神经网络、性别检测、支持向量机、基频
51
TN912.3
国家自然科学基金项目;教育部蓝火计划惠州产学研项目;广东省特支计划项目;广东省自然科学基金项目;广东省科技计划项目;蓝盾产学研基金项目
2020-03-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
118-122