哈夫曼编码乘积量化的图像哈希检索方法

引用

摘要：

目的基于哈希编码的检索方法是图像检索领域中的经典方法 .其原理是将原始空间中相似的图片经哈希函数投影、量化后,在汉明空间中得到相近的哈希码.此类方法一般包括两个过程:投影和量化.投影过程大多采用主成分分析法对原始数据进行降维,但不同方法的量化过程差异较大.对于信息量不均衡的数据,传统的图像哈希检索方法采用等长固定编码位数量化的方式,导致出现低编码效率和低量化精度等问题.为此,本文提出基于哈夫曼编码的乘积量化方法 .方法首先,利用乘积量化法对降维后的数据进行量化,以便较好地保持数据在原始空间中的分布情况.然后,采用子空间方差作为衡量信息量的标准,并以此作为编码位数分配的依据.最后,借助于哈夫曼树,给方差大的子空间分配更多的编码位数.结果在常用公开数据集MNIST、NUS-WIDE和22K LabelMe上进行实验验证,与原始的乘积量化方法相比,所提出方法能平均降低49％的量化误差,并提高19％的平均准确率.在数据集MNIST上,与同类方法的变换编码方法 (TC)进行对比,比较了从32 bit到256 bit编码时的训练时间,本文方法的训练时间能够平均缩短22.5s.结论本文提出了一种基于多位编码乘积量化的哈希方法,该方法提高了哈希编码的效率和量化精度,在平均准确率、召回率等性能上优于其他同类算法,可以有效地应用到图像检索相关领域.

关键词：哈希、图像检索、近似最近邻搜索、乘积量化、比特分配、编码效率

所属期刊栏目：24

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金项目61573273,61603289

在线出版日期：2019-04-30（万方平台首次上网日期，不代表论文的发表时间）

页数：共11页

页码：389-399

英文信息展示

期刊专题