10.16208/j.issn1000-7024.2021.03.022
基于改进NeXtVLAD的视频分类
为提高长视频分类精度并减少训练时占用显存,提出基于NeXtVLAD改进的长视频分类模型.将人脸识别领域的ghost聚类中心思想迁移到视频分类,通过加入ghost聚类中心降低无关采样帧的干扰,提高模型识别准确率,针对长视频分类提出多尺度的视频帧采样方法.采用预训练模型ResNet50提取采样帧的深度特征,在训练时冻结特征提取网络参数,减少训练时的计算量.在VideoNet数据集的前100个类别上进行实验,实验结果表明,该模型与现有相关模型相比取得了更好的分类效果.
深度学习、视频分类、局部聚合描述子向量、特征融合、卷积神经网络
42
TP391.41(计算技术、计算机技术)
2021-04-02(万方平台首次上网日期,不代表论文的发表时间)
共6页
749-754