基于卷积神经网络的食品图像识别

引用

摘要：

目的探究一种基于Inception_V3-CNN模型的食品图像识别和分类方法.方法选取包含20类食品和19609张的食品图像建立数据集Food-101, 通过卷积神经网络(convolutional neural networks, CNN)提取图像候选区域的视觉特征, 并自动进行分类, 使其具有较高的识别率; 此外, 采集来自kaggle库中已标注的食品图像集做预测对比实验, 以保证Inception_V3-CNN模型检测的准确度.结果该方法能够去除背景噪音, 且仅需部分提取视觉特征, 可以有效解决网络食品图像的分类问题, 与多视图支持向量机(support vector machine, SVM)+方向梯度直方图(histogram of oriented gradients, HOG)和传统CNN方法相比, 在测试时间相近、设备计算能力相同的条件下, 该方法识别率更高, 迭代次数为15000次时, Loss值降至4.92, 准确率可达93.89%.结论此方法可以快速识别食品图像, 在实际网络图片中能有较好的可移植性.将算法移植到移动设备中实现APP的模块化操作也将成为后续工作探索的重点方向.

关键词：食品图像、图像检索、图像分类、Inception_V3-CNN、卷积神经网络

所属期刊栏目：10

资助基金：辽宁省高等学校产业技术研究院重大应用研究项目041804;辽宁省重点研发计划指导计划项目2017205003

在线出版日期：2019-10-31（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：6241-6247

英文信息展示

期刊专题