10.3969/j.issn.1003-0530.2009.03.007
基于统计匹配的VoIP说话人特征补偿算法
在VoIP说话人识别中,当使用原始语音(未经过编译码处理)训练的说话人模型识别经过语音编译码处理的测试语音时,系统的识别性能会发生下降.本文给出了一种基于统计匹配和EM(期望最大化)算法的VoIP说话人特征(12阶的LPCC系数)补偿算法,其中对假设失真特征与未失真识别特征间符合非线性(二次函数型)和线性函数关系时的函数参数进行了估计,并使用得到的补偿函数对失真特征进行补偿.实验结果表明,该特征补偿算法对VoIP中广泛使用的G.729 8kb/s、G.723.1 6.3kb/s、G.723.1 5.3kb/s编译码所造成的识别性能下降有较大的改善,其性能也优于CMS(倒谱均值减)方法.
VoIP、说话人识别、统计匹配、EM算法
25
TN912.3
国家高技术研究发展计划2006AA01Z146专项经费资助
2009-04-30(万方平台首次上网日期,不代表论文的发表时间)
共5页
379-383