10.3969/j.issn.1004-9037.2005.04.002
用于文本无关的话者识别的超音段信息提取
提出一种可用于较少语音数据量的文本无关的超音段信息提取方法.通过对基音和能量的轨迹动态分段,提取超音段信息,并使用异方差线性区分分析(HLDA)进行参数优化,克服超音段信息提取对数据量大小的依赖,同时采用混合高斯-统一背景(GMM-UBM)模型结构,建立文本无关话者识别系统.在NIST′01数据库上的实验表明,该系统性能优于基于短时帧的音源信息参数系统,更重要的是不需要大数据量的支持,且与基于短时帧倒谱参数的话者识别系统融合后,系统识别性能明显改善,等误识率相对下降10%.
话者确认、超音段信息、基音、文本无关
20
TN912.34
中国科学院资助项目60272039
2006-01-19(万方平台首次上网日期,不代表论文的发表时间)
共5页
376-380