10.3969/j.issn.1006-8961.2004.07.022
一种基于三维模型和照片的合成"说话头"
视觉语音的研究已经成为人机交互技术中一个非常活跃的领域,在语音的相关视觉信息当中,最主要的是说话人的口型乃至整个头部的图像,即"说话头"(talking head).为了合成具有真实感的三维"说话头"模型,提出了一种基于三维模型和真人照片来合成真实"说话头"的方法,即在一个中性的三维人头部模型的基础上,从任意人的正面和侧面两张照片当中,通过提取脸形和五官位置等特征参数来校正模型,并且从照片中提取皮肤和头发等纹理,使得合成的模型能在较大程度上贴近真人.该方法综合了基于三维模型和基于图像库的建模方法,因此同时具有两者的优点,即既能够灵活控制表情和口型,又可自由旋转,不仅可实时合成,而且合成效果接近真人,自然度高.已将此模型应用于视觉语音合成系统,并获得了满意的效果.
说话头、视觉语音合成、三维模型、人脸动画
9
TP391.41(计算技术、计算机技术)
2004-08-26(万方平台首次上网日期,不代表论文的发表时间)
共7页
886-892