10.3321/j.issn:0254-4164.2007.05.009
一种基于层次距离计算的聚类算法
针对广泛存在的层次编码型数据类型,提出了层次距离的新概念,证明了相关的数学性质,并在此基础上提出并实现了新的基于层次距离计算的聚类算法HDCA(Hierarchy Distance Computing based clustering Algorithm).新方法克服了传统聚类算法标称型计算的缺陷,提高了聚类精度.针对聚类算法的中心点问题,提出了相应的层次编码型数据的快速处理算法,并从理论上证明了算法的正确性.实验表明,对比朴素处理算法,HDCA的性能明显提高.新算法已经应用到警用流动人口分析当中,取得了良好效果.
聚类、层次距离、层次编码变量、k-中心、数据挖掘
30
TP311(计算技术、计算机技术)
国家自然科学基金60473071;60473051;60503037;中国博士后科学基金20060400002;四川省青年科技基金07ZQ026-055;国家高技术研究发展计划863计划2006AA01Z230;北京市自然科学基金4062018
2007-07-02(万方平台首次上网日期,不代表论文的发表时间)
共10页
786-795