基于独立注意力机制的图像检索算法
近年来,深度学习的方法在基于内容的图像检索领域已经占据主导地位.为了改善主干网络提取出的特征,使得网络能计算出更具区分度的图像描述,提出了一种独立于输入特征的注意力模块ICSA(Independent Channel-wise and Spatial At-tention).该模块与其他的注意力机制的主要区别在于它的注意力权重在输入不同特征时保持一致,传统注意力模块通过对输入特征进行处理得到注意力,因此它的模型更为精简,其参数大小仅有6.7 kB,为SENet 大小的5.2%和CBAM 的2.6%,运行时间与SENet 基本一致,为CBAM 的14.9%.ICSA 的注意力分为通道和空间注意力两部分,分别储存输入特征不同方向上的权重.在Pittsburgh 数据集上进行实验,实验结果表明,对于不同的主干网络,在添加了ICSA 模块后Recall@1 有0.1%~2.4%的提升.
基于内容的图像检索、注意力机制、特征增强
50
TP391(计算技术、计算机技术)
2023-09-06(万方平台首次上网日期,不代表论文的发表时间)
共6页
318-323