关注全局真实度的文本到图像生成

引用

摘要：

针对文本和图像模态在高维空间中相互映射的困难问题,提出以全局句子向量为输入,以堆叠式结构为基础的生成对抗网络(GAN),应用于文本生成图像任务.该网络融入双重注意力机制,在空间和通道两大维度上寻求特征融合的更大化,同时增加真实度损失判别器作为约束.所提方法在加利福尼亚理工学院的CUB鸟类数据集上实验验证,用Inception Score和SSIM作为评估指标.结果表明,生成图像具有更真实的细节纹理,视觉效果更加接近于真实图像.

关键词：文本生成图像、堆叠式生成对抗网络、双重注意力机制、真实度损失、文本检测

所属期刊栏目：31

分类号：TP391.41;TP183;TN911.73

在线出版日期：2022-06-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：388-393

英文信息展示

期刊专题