基于多域VQGAN的文本生成国画方法研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.13328/j.cnki.jos.006769

基于多域VQGAN的文本生成国画方法研究

引用
随着生成式对抗网络的出现,?从文本描述合成图像最近成为一个活跃的研究领域.?然而,?目前文本描述往往使用英文,?生成的对象也大多是人脸和花鸟等,?专门针对中文和中国画的研究较少.?同时,?文本生成图像任务往往需要大量标注好的图像文本对,?制作数据集的代价昂贵.?随着多模态预训练的出现与推进,?使得能够以一种优化的方式来指导生成对抗网络的生成过程,?大大减少了对数据集和计算资源的需求.?提出一种多域VQGAN模型来同时生成多种域的中国画,?并利用多模态预训练模型WenLan来计算生成图像和文本描述之间的距离损失,?通过优化输入多域VQGAN的隐空间变量来达到图片与文本语义一致的效果.?对模型进行了消融实验,?详细比较了不同结构的多域VQGAN的FID及R-precisoin指标,?并进行了用户调查研究.?结果表示,?使用完整的多域VQGAN模型在图像质量和文本图像语义一致性上均超过原VQGAN模型的生成结果.

文本生成图像、多域生成、中国画生成

34

TP391(计算技术、计算机技术)

国家自然科学基金;国家自然科学基金;北京高等学校卓越青年科学家计划

2023-05-11(万方平台首次上网日期,不代表论文的发表时间)

共18页

2116-2133

相关文献
评论
暂无封面信息
查看本期封面目录

软件学报

1000-9825

11-2560/TP

34

2023,34(5)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn