10.11996/JG.j.2095-302X.2016010066
基于视觉词袋的视频检索校准方法
随着互联网技术的飞速发展,视频数据呈现海量爆炸式增长,传统的视频搜索引擎多数采用单一的基于文本的检索方法,该检索方法对于视频这类非结构化数据,存在着内容缺失、语义隔阂等问题,导致检索结果相关度较低。提出一种基于视觉词袋的视频检索校准方法,该方法结合了视频数据的可视化特征提取技术、TF-IDF 技术、开放数据技术,为用户提供优化后的视频检索校准结果。首先,基于HSV模型的聚类算法提取视频的关键帧集合及关键帧权值向量;接着用关键帧图像的加速稳健特征等表示视频的内容特征,解决视频检索的内容缺失问题;然后利用 TF-IDF 技术衡量查询语句关键字的权值,并开放数据获得查询语句关键字的可视化特征和语义信息,解决视频检索的语义隔阂问题;最后,将提出的基于视觉词袋的视频检索校准算法应用于Internet Archive数据集。实验结果表明,与传统的基于文本的视频检索方法相比,该方法的平均检索结果相关度提高了15%。
视觉词袋、加速稳健特征、TF-IDF、关键帧提取、开放数据、检索校准
TP391(计算技术、计算机技术)
国家自然科学基金项目61373030,71171132;上海市自然科学基金项目13ZR1419800
2016-04-05(万方平台首次上网日期,不代表论文的发表时间)
共8页
66-73