基于全局交互的图像语义理解方法
针对图像语义生成过程中图像信息易模糊的问题,提出基于双向门控循环单元(GRU)和图像信息全局交互相结合的图像语义生成模型,通过图像和文本数据进行正则化处理和文本向量映射方法,实现模型驱动的图像语义生成.实验结果表明,所提出模型能较好地解决数据稀疏和偏态问题,采用GUR单元可以进一步降低模型参数规模,加快算法收敛速度,有效抑制模型过拟合,提高图像内容的丰富度、准确性和逻辑性.
卷积神经网络、循环神经网络、图像语义理解、全局交互机制、数据正则化、门控循环单元
35
TP273(自动化技术及设备)
国家重点研发计划项目;国家自然科学基金项目
2020-07-21(万方平台首次上网日期,不代表论文的发表时间)
共9页
2103-2111