10.3778/j.issn.1673-9418.2007.03.004
基于树编辑距离的层次聚类算法
为了识别犯罪嫌疑人伪造和篡改的虚假身份,利用树编辑距离计算个体属性相似性,证明了树编辑距离的相关数学性质,对属性应用层次编码方法,提出了一种新的基于树编辑距离的层次聚类算法HCTED(Hierarchical Clustering Algorithm Based on Tree Edit Distance).新算法通过树编辑操作使用最少的代价计算属性相似性,克服了传统聚类算法标称型计算的缺陷,提高了聚类精度,通过设定阈值对给定样本聚类.实验证明了新方法在身份识别上的准确性和有效性,讨论了不同参数对实验结果的影响,对比传统聚类算法,HCTED算法性能明显提高.新算法已经应用到警用流动人口分析中,取得了良好效果.
树编辑距离、层次聚类、属性相似性、数据挖掘
1
TP311(计算技术、计算机技术)
国家自然科学基金60773169;60473071;中国博士后科学基金20060400002;四川省青年科技基金2007Q14-055;08JJ0109
2008-05-12(万方平台首次上网日期,不代表论文的发表时间)
共11页
282-292