DOI：10.3969/j.issn.1673-629X.2020.05.015

基于GMM-UBM的声纹识别技术的特征参数研究

引用

摘要：

声纹识别技术实现的关键点在于从语音信号中提取语音特征参数,此参数具备表征说话人特征的能力.基于GMM-UBM模型,通过Matlab实现文本无关的声纹识别系统,对主流静态特征参数MFCC、LPCC、LPC以及结合动态参数的MFCC,从说话人确认与说话人辨认两种应用角度进行性能比较.在取不同特征参数阶数、不同高斯混合度和使用不同时长的训练语音与测试语音的情况下,从理论识别效果、实际识别效果、识别所用时长、识别时长占比等多个方面进行了分析与研究.最终结果表明:在GMM-UBM模式识别方法下,三种静态特征参数中MFCC绝大多数时候具有最佳识别效果,同时其系统识别耗时最长;识别率与语音特征参数的阶数之间并非单调上升关系.静态参数在结合较佳阶数的动态参数时能够提升识别效果;增加动态参数阶数与提高系统识别效果之间无必然联系.

关键词：GMM-UBM、声纹识别、特征参数性能、说话人确认、说话人辨认

所属期刊栏目：30

分类号：TP301(计算技术、计算机技术)

资助基金：全国高校计算机基础教学研究;改革课题;南京大学金陵学院重点教改项目

在线出版日期：2020-05-28（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：76-83

英文信息展示

期刊专题