DOI：10.3969/j.issn.1003-0530.2009.03.007

基于统计匹配的VoIP说话人特征补偿算法

引用

摘要：

在VoIP说话人识别中,当使用原始语音(未经过编译码处理)训练的说话人模型识别经过语音编译码处理的测试语音时,系统的识别性能会发生下降.本文给出了一种基于统计匹配和EM(期望最大化)算法的VoIP说话人特征(12阶的LPCC系数)补偿算法,其中对假设失真特征与未失真识别特征间符合非线性(二次函数型)和线性函数关系时的函数参数进行了估计,并使用得到的补偿函数对失真特征进行补偿.实验结果表明,该特征补偿算法对VoIP中广泛使用的G.729 8kb/s、G.723.1 6.3kb/s、G.723.1 5.3kb/s编译码所造成的识别性能下降有较大的改善,其性能也优于CMS(倒谱均值减)方法.

关键词：VoIP、说话人识别、统计匹配、EM算法

所属期刊栏目：25

分类号：TN912.3

资助基金：国家高技术研究发展计划2006AA01Z146专项经费资助

在线出版日期：2009-04-30（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：379-383

英文信息展示

期刊专题