DOI：10.3969/j.issn.1006-8961.2004.07.022

一种基于三维模型和照片的合成"说话头"

引用

摘要：

视觉语音的研究已经成为人机交互技术中一个非常活跃的领域,在语音的相关视觉信息当中,最主要的是说话人的口型乃至整个头部的图像,即"说话头"(talking head).为了合成具有真实感的三维"说话头"模型,提出了一种基于三维模型和真人照片来合成真实"说话头"的方法,即在一个中性的三维人头部模型的基础上,从任意人的正面和侧面两张照片当中,通过提取脸形和五官位置等特征参数来校正模型,并且从照片中提取皮肤和头发等纹理,使得合成的模型能在较大程度上贴近真人.该方法综合了基于三维模型和基于图像库的建模方法,因此同时具有两者的优点,即既能够灵活控制表情和口型,又可自由旋转,不仅可实时合成,而且合成效果接近真人,自然度高.已将此模型应用于视觉语音合成系统,并获得了满意的效果.

关键词：说话头、视觉语音合成、三维模型、人脸动画

所属期刊栏目：9

分类号：TP391.41(计算技术、计算机技术)

在线出版日期：2004-08-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：886-892

英文信息展示

期刊专题