DOI：10.16208/j.issn1000-7024.2021.03.022

基于改进NeXtVLAD的视频分类

引用

摘要：

为提高长视频分类精度并减少训练时占用显存,提出基于NeXtVLAD改进的长视频分类模型.将人脸识别领域的ghost聚类中心思想迁移到视频分类,通过加入ghost聚类中心降低无关采样帧的干扰,提高模型识别准确率,针对长视频分类提出多尺度的视频帧采样方法.采用预训练模型ResNet50提取采样帧的深度特征,在训练时冻结特征提取网络参数,减少训练时的计算量.在VideoNet数据集的前100个类别上进行实验,实验结果表明,该模型与现有相关模型相比取得了更好的分类效果.

关键词：深度学习、视频分类、局部聚合描述子向量、特征融合、卷积神经网络

所属期刊栏目：42

分类号：TP391.41(计算技术、计算机技术)

在线出版日期：2021-04-02（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：749-754

英文信息展示

期刊专题