基于视觉词袋的视频检索校准方法

引用

摘要：

随着互联网技术的飞速发展，视频数据呈现海量爆炸式增长，传统的视频搜索引擎多数采用单一的基于文本的检索方法，该检索方法对于视频这类非结构化数据，存在着内容缺失、语义隔阂等问题，导致检索结果相关度较低。提出一种基于视觉词袋的视频检索校准方法，该方法结合了视频数据的可视化特征提取技术、TF-IDF 技术、开放数据技术，为用户提供优化后的视频检索校准结果。首先，基于HSV模型的聚类算法提取视频的关键帧集合及关键帧权值向量；接着用关键帧图像的加速稳健特征等表示视频的内容特征，解决视频检索的内容缺失问题；然后利用 TF-IDF 技术衡量查询语句关键字的权值，并开放数据获得查询语句关键字的可视化特征和语义信息，解决视频检索的语义隔阂问题；最后，将提出的基于视觉词袋的视频检索校准算法应用于Internet Archive数据集。实验结果表明，与传统的基于文本的视频检索方法相比，该方法的平均检索结果相关度提高了15%。

关键词：视觉词袋、加速稳健特征、TF-IDF、关键帧提取、开放数据、检索校准

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金项目61373030，71171132；上海市自然科学基金项目13ZR1419800

在线出版日期：2016-04-05（万方平台首次上网日期，不代表论文的发表时间）

页数：共8页

页码：66-73

英文信息展示

期刊专题