10.3969/j.issn.1007-7162.2015.04.026
融合AP和GMM的说话人识别方法研究
针对在说话人识别过程中经典的高斯混合模型( Gaussian Mixture Model,GMM)阶数的确定具有很大随意性的问题,提出采用吸引子传播聚类方法( AP聚类)自动获取GMM的阶数,进而实现说话人识别的方法.首先,采用Mel频率倒谱系数法( MFCC)与差分倒谱相结合的方法,提取语音特征参数;其次,采用吸引子传播聚类方法( AP聚类)对语音特征参数进行聚类处理,从而自动获得GMM的阶数;在此基础上进行GMM模型的训练;最后,采用训练好的GMM模型对Timit标准语音库以及自制网络志愿者语音库进行说话人识别测试实验.实验结果为:使用了AP聚类算法获取GMM阶数的情况下,对Timit标准语音库的测试结果为100%;在自制网络志愿者语音库中,训练样本为168个,其中潮汕话样本10个,湖南话样本10个,测试样本为42个,测试结果为97.6%.实验结果表明,引入AP聚类自动获取GMM的阶数,可以显著提高说话人识别的精度和效率.
说话人识别、MFCC、AP聚类算法、高斯混合模型
32
TP391.4(计算技术、计算机技术)
广东省科技计划项目2010A030500006
2015-12-10(万方平台首次上网日期,不代表论文的发表时间)
共5页
145-149