双语图像标题联合生成研究
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11896/jsjkx.190900181

双语图像标题联合生成研究

引用
图像标题(Image Caption)的研究大多是对图像生成单一语言的标题,而在当今各国语言交汇融合的情况下,对一张图像生成两门甚至多门语言标题是必然趋势,以让不同母语的人理解其他人对同一张图片的评价.对此,提出一种双语图像标题,即图像同时生成两种语言标题的方法.该方法由一个编码器和两个不同的解码器组成,其中编码器基于卷积神经网络,用于提取图像特征;解码器基于长短时记忆网络,两个不同的解码器分别用于解码两种不同的语言特征.由于两种语言标题之间存在着互译的特性,因此提出了双语料图像标题的联合生成模型.具体地,在解码端采用交替的方式生成两种语言的标题,使得在预测某种语言的下一个单词时,不仅可以利用该语言标题的历史信息,还可以利用另一门语言标题的历史信息,同时促进两种语言标题生成的性能.基于 MSCOCO20 14 数据集的实验结果表明,双语图像标题联合生成能够同时提高两门语言的性能,在英文上较英文单语言标题生成的性能提高了 1 .0 个BLEU_4 值和0.9 8 个CIDEr值,在日文上较日文单语言标题生成的性能提高了 1 .0 个BLEU_4 值和0.3 1 个CIDEr值.

图像双语标题、联合模型、交替生成

47

TP391.1;TP391.41(计算技术、计算机技术)

国家自然科学基金61876120

2020-12-28(万方平台首次上网日期,不代表论文的发表时间)

共7页

183-189

相关文献
评论
暂无封面信息
查看本期封面目录

计算机科学

1002-137X

50-1075/TP

47

2020,47(12)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn