基于多通道视觉注意力的细粒度图像分类

引用

摘要：

视觉注意力机制在细粒度图像分类中得到了广泛的应用.现有方法多是构建一个注意力权重图对特征进行简单加权处理.对此,本文提出了一种基于可端对端训练的深度神经网络模型实现的多通道视觉注意力机制,首先通过多视觉注意力图描述对应于视觉物体的不同区域,然后提取对应高阶统计特性得到相应的视觉表示.在多个标准的细粒度图像分类测试任务中,基于多通道视觉注意的视觉表示方法均优于近年主流方法.

关键词：图像分类、细粒度图像分析、视觉注意力、图像表示、深度学习

所属期刊栏目：34

分类号：TP391.4(计算技术、计算机技术)

资助基金：国家自然科学基金U1613211

在线出版日期：2019-04-10（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：157-166

英文信息展示

期刊专题