主成分分析和K-means聚类在说话人识别中的应用

引用

摘要：

为了解决特征提取计算量大且特征参数不够全面的问题，提出了用主成分分析和K-means聚类进行语音特征参数提取的方法。通过对说话人识别系统中最常用的线性预测倒谱系数( LPCC)参数和梅尔倒谱系数( MFCC)参数提取原理以及差分参数的提取算法深入研究，选择LPCC、MFCC以及其一阶差分参数的组合作为最终混合特征参数。首先用主成分分析降低每一帧语音信号特征参数的阶数，然后经过K-means聚类降低帧数，最后通过矢量量化( VQ)来进行说话人识别。实验结果表明，该方法降低了计算复杂度，同时也提升了识别准确性。

关键词：主成分分析、K-means聚类、混合特征参数、矢量量化、说话人识别

分类号：TP181(自动化基础理论)

资助基金：广西自然科学基金资助项目2012GXNSFAA053221;广西千亿元产业产学研用合作项目。

在线出版日期：2015-08-28（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：127-129

英文信息展示

期刊专题