10.3321/j.issn:1002-8331.2006.12.026
基于唇动的说话人识别技术
针对说话人识别技术多基于语音的现状,文章提出了一种新颖的基于唇动的说话人识别技术.通过离散余弦变换,从说话人讲话时的图像序列提取那些既反映说话人嘴部生理特性也反映了说话人唇动的行为特性的视觉特征.基于这些特征,为说话人建立静态-动态混合模型,其中使用半连续隐马尔可夫模型为说话人建立动态模型.在一个小型的视觉语料库上,我们分别对说话人辨认系统和确认系统进行实现.对说话人辨认系统,其文本有关与文本无关模式的正确率分别达到了100%和99.7%;对说话人确认系统,文本有关与文本无关模式的等错误率分别为0.09%与0.33%.
唇动、说话人辨认、说话人确认、隐马尔可夫模型、离散余弦变换
42
TP391(计算技术、计算机技术)
2006-05-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
85-88