哈夫曼编码乘积量化的图像哈希检索方法
目的 基于哈希编码的检索方法 是图像检索领域中的经典方法 .其原理是将原始空间中相似的图片经哈希函数投影、量化后,在汉明空间中得到相近的哈希码.此类方法 一般包括两个过程:投影和量化.投影过程大多采用主成分分析法对原始数据进行降维,但不同方法 的量化过程差异较大.对于信息量不均衡的数据,传统的图像哈希检索方法 采用等长固定编码位数量化的方式,导致出现低编码效率和低量化精度等问题.为此,本文提出基于哈夫曼编码的乘积量化方法 .方法 首先,利用乘积量化法对降维后的数据进行量化,以便较好地保持数据在原始空间中的分布情况.然后,采用子空间方差作为衡量信息量的标准,并以此作为编码位数分配的依据.最后,借助于哈夫曼树,给方差大的子空间分配更多的编码位数.结果 在常用公开数据集MNIST、NUS-WIDE和22K LabelMe上进行实验验证,与原始的乘积量化方法 相比,所提出方法 能平均降低49%的量化误差,并提高19%的平均准确率.在数据集MNIST上,与同类方法 的变换编码方法 (TC)进行对比,比较了从32 bit到256 bit编码时的训练时间,本文方法 的训练时间能够平均缩短22.5s.结论 本文提出了一种基于多位编码乘积量化的哈希方法,该方法 提高了哈希编码的效率和量化精度,在平均准确率、召回率等性能上优于其他同类算法,可以有效地应用到图像检索相关领域.
哈希、图像检索、近似最近邻搜索、乘积量化、比特分配、编码效率
24
TP391(计算技术、计算机技术)
国家自然科学基金项目61573273,61603289
2019-04-30(万方平台首次上网日期,不代表论文的发表时间)
共11页
389-399