主成分分析和K-means聚类在说话人识别中的应用
为了解决特征提取计算量大且特征参数不够全面的问题,提出了用主成分分析和K-means聚类进行语音特征参数提取的方法。通过对说话人识别系统中最常用的线性预测倒谱系数( LPCC)参数和梅尔倒谱系数( MFCC)参数提取原理以及差分参数的提取算法深入研究,选择LPCC、MFCC以及其一阶差分参数的组合作为最终混合特征参数。首先用主成分分析降低每一帧语音信号特征参数的阶数,然后经过K-means聚类降低帧数,最后通过矢量量化( VQ)来进行说话人识别。实验结果表明,该方法降低了计算复杂度,同时也提升了识别准确性。
主成分分析、K-means聚类、混合特征参数、矢量量化、说话人识别
TP181(自动化基础理论)
广西自然科学基金资助项目2012GXNSFAA053221;广西千亿元产业产学研用合作项目。
2015-08-28(万方平台首次上网日期,不代表论文的发表时间)
共3页
127-129