10.3969/j.issn.1673-629X.2013.05.008
基于相似性度量的高维数据聚类算法研究
高维数据空间中的高维数据相似性度量问题是一个具有挑战性的课题.针对传统数据相似性度量算法在高维数据空间的不适应性,通过对传统的距离度量方法进行分析,结合高维数据特性,提出了高维数据相似性度量函数Esim( X, Y ).将其与已有的相似性度量函数Hsim( X,Y )进行比较,得出改进的算法在高维相似性度量方面的优越性,特别是在高值数据之间与低值数据之间的相对差异方面更具优势.利用数值型数据集进行实验分析,验证了该函数在高维数据空间聚类的有效性和合理性.
高维数据、相似性度量、数据聚类
TP311.1(计算技术、计算机技术)
2013-06-07(万方平台首次上网日期,不代表论文的发表时间)
共4页
30-33