基于加权自学习散列的高维数据最近邻查询算法

引用

摘要：

因为查询和存储具有高效性,学习型散列逐渐被应用于解决最近邻查询问题.学习型散列将高维数据转化成二进制编码,并使得原始高维空间中越相似的数据对应二进制编码的汉明距离越小.在实际应用中,每次查询都会返回许多与查询点汉明距离相同而编码互不相同的数据.如何对这些数据进行排序是一个难题.提出了一种基于加权自学习散列的近邻查找算法.实验结果表明,算法能够高效地对具有相同汉明距离的不同编码进行重排序,加权排序后查询的F1值约是原来的2倍并优于同系算法,时间开销可比直接计算原始距离进行排序降低一个数量级.

关键词：最近邻查询、学习型散列、加权自学习、高维数据

所属期刊栏目：33

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目61472194,61572266;浙江省自然科学基金资助项目No.LY16F020003The National Natural Science Foundation of China61472194,61572266;Zhejiang Provincial Natural Science Foundation of ChinaLY16F020003

在线出版日期：2017-07-26（万方平台首次上网日期，不代表论文的发表时间）

页数：共13页

页码：73-85

英文信息展示

期刊专题