10.3969/j.issn.1003-6059.2006.06.016
利用语音非线性特征改进说话人识别的性能
分析说话人发音过程中的非线性现象,通过计算38个汉语音素的最大Lyapunov指数验证语音内含混沌性.从不同侧面讨论语音非线性特征量的物理意义和计算方法,包括Lyapunov指数、二阶熵和相关维数,并将这些非线性特征用于说话人识别.在Gauss混合模型的说话人识别系统中,基于MFCC参数得到识别结果的基础上,用最大Lyapunov指数、二阶熵和相关维数再进行说话人的二次辨认,提高说话人识别的性能.实验结果表明非线性特征参数中包含有说话人特征的信息,因此可用于改进基于MFCC的识别性能.
说话人识别、混沌、最大Lyapunov指数
19
TP391(计算技术、计算机技术)
2009-08-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
776-781