10.16208/j.issn1000-7024.2023.01.028
基于语义分割的全卷积图像描述模型
为快速生成准确描述图片内容的语句,提出语义分割和卷积神经网络(convolutional neural network,CNN)相结合的图像描述方法.将图像分类模型和语义分割模型结合为编码器,增强对图像语义信息的利用,采用CNN代替长短时记忆网络(long short term memory,LSTM)作为解码器生成完整描述性语句.通过在MSCOCO数据集上与5种主流算法的对比实验可知,以CNN作为解码器能够大幅提高解码速度,语义信息的增强能够有效提高实验精度,验证了该方法的有效性和可行性.
图像描述、语义分割、卷积神经网络、编码器、语义信息、长短时记忆网络、解码速度
44
TP391(计算技术、计算机技术)
国家自然科学基金61906068
2023-02-10(万方平台首次上网日期,不代表论文的发表时间)
共8页
210-217