DOI：10.3969/j.issn.1007-7162.2015.04.026

融合AP和GMM的说话人识别方法研究

引用

摘要：

针对在说话人识别过程中经典的高斯混合模型( Gaussian Mixture Model,GMM)阶数的确定具有很大随意性的问题,提出采用吸引子传播聚类方法( AP聚类)自动获取GMM的阶数,进而实现说话人识别的方法.首先,采用Mel频率倒谱系数法( MFCC)与差分倒谱相结合的方法,提取语音特征参数;其次,采用吸引子传播聚类方法( AP聚类)对语音特征参数进行聚类处理,从而自动获得GMM的阶数;在此基础上进行GMM模型的训练;最后,采用训练好的GMM模型对Timit标准语音库以及自制网络志愿者语音库进行说话人识别测试实验.实验结果为:使用了AP聚类算法获取GMM阶数的情况下,对Timit标准语音库的测试结果为100%;在自制网络志愿者语音库中,训练样本为168个,其中潮汕话样本10个,湖南话样本10个,测试样本为42个,测试结果为97.6%.实验结果表明,引入AP聚类自动获取GMM的阶数,可以显著提高说话人识别的精度和效率.

关键词：说话人识别、MFCC、AP聚类算法、高斯混合模型

所属期刊栏目：32

分类号：TP391.4(计算技术、计算机技术)

资助基金：广东省科技计划项目2010A030500006

在线出版日期：2015-12-10（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：145-149

英文信息展示

期刊专题