10.3969/j.issn.1674-7259.2007.12.001
一种基于编码的双距离树高维索引
提出一种基于编码的双距离树(EDD-tree)高维索引结构. 对于高维空间中的数据点,首先通过k平均聚类算法将其聚成若干类, 然后分别计算每个点对应的始点和质心距离, 并对其进行编码得到对应的统一化索引键值, 最后用基于分片的B+树建立索引. 这样, 高维空间的查询就转变成对一维空间的检索. 实验证明该方法能更有效地缩小搜索空间, 减少距离计算的代价. 理论分析和实验都表明, EDD-tree索引在查询效率方面要明显优于其他的索引方法, 尤其适合海量高维数据的查询.
k近邻查询、类超球、质心片、始点片
37
TP3(计算技术、计算机技术)
国家自然科学基金重点项目60533090;国家杰出青年科学基金60525108;国家自然科学基金60272031;高等学校中英文图书数字化国际合作项目
2008-04-09(万方平台首次上网日期,不代表论文的发表时间)
共13页
1491-1503