关注全局真实度的文本到图像生成
针对文本和图像模态在高维空间中相互映射的困难问题,提出以全局句子向量为输入,以堆叠式结构为基础的生成对抗网络(GAN),应用于文本生成图像任务.该网络融入双重注意力机制,在空间和通道两大维度上寻求特征融合的更大化,同时增加真实度损失判别器作为约束.所提方法在加利福尼亚理工学院的CUB鸟类数据集上实验验证,用Inception Score和SSIM作为评估指标.结果表明,生成图像具有更真实的细节纹理,视觉效果更加接近于真实图像.
文本生成图像、堆叠式生成对抗网络、双重注意力机制、真实度损失、文本检测
31
TP391.41;TP183;TN911.73
2022-06-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
388-393