YOLOv3和双线性特征融合的细粒度图像分类

引用

摘要：

目的细粒度图像分类是计算机视觉领域具有挑战性的课题,目的是将一个大的类别分为更详细的子类别,在工业和学术方面都有着十分广泛的研究需求.为了改善细粒度图像分类过程中不相关背景干扰和类别差异特征难以提取的问题,提出了一种将目标检测方法YOLOv3(you only look once)和双线性融合网络相结合的细粒度分类优化算法,以此提高细粒度图像分类的性能.方法利用重新训练过的目标检测算法YOLOv3粗略确定目标在图像中的位置;使用背景抑制方法消除目标以外的信息干扰;利用融合不同通道、不同层级卷积层特征的方法对经典的细粒度分类算法双线性卷积神经网络(bilinear convolutional neural network,B-CNN)进行改进,优化分类性能,通过融合双线性网络中不同卷积层的特征向量,得到更加丰富的互补信息,从而提高细粒度分类精度.结果实验结果表明,在CUB-200-2011(Caltech-UCSD Birds-200-2011)、Cars196和Aircrafts100数据集中,本文算法的分类准确率分别为86.3％、92.8％和89.0％,比经典的B-CNN细粒度分类算法分别提高了2.2％、1.5％和4.9％,验证了本文算法的有效性.同时,与已有细粒度图像分类算法相比也表现出一定的优势.结论改进算法使用YOLOv3有效滤除了大量无关背景,通过特征融合方法来改进双线性卷积神经分类网络,丰富特征信息,使分类的结果更加精准.

关键词：细粒度图像分类、目标检测、背景抑制、特征融合、双线性卷积神经网络(B-CNN)

所属期刊栏目：26

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金项目61703423,61473309,61379104

在线出版日期：2021-05-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共10页

页码：847-856

英文信息展示

期刊专题