聚焦—识别网络架构的细粒度图像分类

引用

摘要：

目的细粒度图像分类是指对一个大类别进行更细致的子类划分,如区分鸟的种类、车的品牌款式、狗的品种等.针对细粒度图像分类中的无关信息太多和背景干扰问题,本文利用深度卷积网络构建了细粒度图像聚焦-识别的联合学习框架,通过去除背景、突出待识别目标、自动定位有区分度的区域,从而提高细粒度图像分类识别率.方法首先基于Yolov2(youonly look once v2)的网络快速检测出目标物体,消除背景干扰和无关信息对分类结果的影响,实现聚焦判别性区域,之后将检测到的物体(即Yolov2的输出)输入双线性卷积神经网络进行训练和分类.此网络框架可以实现端到端的训练,且只依赖于类别标注信息,而无需借助其他的人工标注信息.结果在细粒度图像库CUB-200-2011、Cars196和Aircrafts100上进行实验验证,本文模型的分类精度分别达到84.5％、92％和88.4％,与同类型分类算法得到的最高分类精度相比,准确度分别提升了0.4％、0.7％和3.9％,比使用两个相同D (dence)-Net网络的方法分别高出0.5％、1.4％和4.5％.结论使用聚焦-识别深度学习框架提取有区分度的区域对细粒度图像分类有积极作用,能够滤除大部分对细粒度图像分类没有贡献的区域,使得网络能够学习到更多有利于细粒度图像分类的特征,从而降低背景干扰对分类结果的影响,提高模型的识别率.

关键词：细粒度图像分类、目标检测、双线性卷积神经网络、聚焦—识别框架、区分度

所属期刊栏目：24

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金项目61673276,61603255

在线出版日期：2019-05-22（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：493-502

英文信息展示

期刊专题