基于Faster R-CNN的食品图像检索和分类

引用

摘要：

面向食品领域的图像检索和分类等方面的研究成为多媒体分析和应用领域越来越受关注的研究课题之一.当前的主要研究方法基于全图提取视觉特征,但由于食品图像背景噪音的存在使得提取的视觉特征不够鲁棒,进而影响食品图像检索和分类的性能.为此,本文提出了一种基于Faster R-CNN网络的食品图像检索和分类方法.首先通过Faster R-CNN检测图像中的候选食品区域,然后通过卷积神经网络(CNN)方法提取候选区域的视觉特征,避免了噪音的干扰使得提取的视觉特征更具有判别力.此外,选取来自视觉基因库中标注好的食品图像集微调Faster R-CNN网络,以保证Faster R-CNN食品区域检测的准确度.在包括233类菜品和49168张食品图像的Dish-233数据集上进行实验.全面的实验评估表明:基于Faster R-CNN食品区域检测的视觉特征提取方法可以有效地提高食品图像检索和分类的性能.

关键词：食品图像、图像检索、图像分类、深度学习、FasterR-CNN、卷积神经网络

所属期刊栏目：9

分类号：TP391.41(计算技术、计算机技术)

资助基金：国家自然科学基金61532018,61602437,61672497,61472229,61202152;北京市科技计划D161100001816001;山东省自然科学基金ZR2017MF02;山东省科技发展计划2016ZDJS02A11,2014GGX101035,2014BSB01020

在线出版日期：2017-12-14（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：635-641

英文信息展示

期刊专题