DOI：10.11772/j.issn.1001-9081.2019101757

融合语义标签和噪声先验的图像生成

引用

摘要：

针对现有生成模型难以直接从复杂语义标签生成高分辨率图像的问题,提出了融合语义标签和噪声先验的生成对抗网络(SLNP-GAN).首先,直接输入语义标签(包含形状、位置和类别等信息),使用全局生成器对其进行编码,并结合噪声先验来学习粗粒度的全局属性,初步合成低分辨率图像;然后,基于注意力机制,使用局部细化生成器来查询低分辨率图像子区域对应的高分辨率子标签,获取细粒度信息,从而生成纹理清晰的复杂图像;最后,采用改进的引入动量的Adam算法(AMM)算法来优化对抗训练.实验结果表明,与现有方法text2img相比,所提方法的像素精确度(PA)在COCO_Stuff和ADE20K数据集上分别提高了23.73％和11.09％;相较于Adam算法,AMM算法收敛速度提升了约一倍,且损失值波幅较小.可见,SLNP-GAN能高效地获取全局特征和局部纹理,生成细粒度、高质量的图像.

关键词：语义标签、噪声先验、注意力机制、引入动量的Adam算法、生成对抗网络

所属期刊栏目：40

分类号：TP391.4(计算技术、计算机技术)

资助基金：国家自然科学基金青年科学基金资助项目;山东省研究生教育质量提升计划项目;曲阜师范大学交叉学科研究项目

在线出版日期：2020-06-02（万方平台首次上网日期，不代表论文的发表时间）

页数：共9页

页码：1431-1439

英文信息展示

期刊专题