DOI：10.11835/j.issn.1000-582X.2017.05.011

语谱特征的身份认证向量识别方法

引用

摘要：

针对采用梅尔频率倒谱系数(rel-frequency cepstrum coefficient,MFCC)作为身份认证向量(identity vector,i-vector)进行说话人识别存在语音信息不全的问题,提出一种基于语谱特征的身份认证向量识别说话人的方法.语音信号经过预加重、分帧加窗预处理之后,通过短时傅立叶变换转换成语谱图,语谱图被提交到高斯通用背景模型,在高维均值超向量空间中选择合适的低维线性子空间流型结构以构造符合正态分布的向量作为身份认证向量.这些获取的身份认证向量经过线性判别性分析实现降维并存储.最后采用对数似然比(log-likelihood ratio,LLR)方法对训练和测试阶段的i-vector进行评分,完成说话人识别.以TIMIT数据库为标准的数值实验结果表明,相比采用MFCC作为特征的识别方法,研究的等错误率(equal error rate,EER)更低.

关键词：语谱图、身份认证向量、说话人识别

所属期刊栏目：40

分类号：TP391.42(计算技术、计算机技术)

资助基金：重庆市教育成果转化基金资助项目KJZH14207.Supported by the Chongqing Education Achievement Conversion Foundation KJZH14207

在线出版日期：2017-07-06（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：88-94

英文信息展示

期刊专题