10.3969/j.issn.1000-7024.2014.08.008
基于变长聚类的多敏感属性概率 k-匿名算法
充分考虑记录之间的距离以及记录本身权重值对聚类种子选择的影响,建立聚类种子选取模型,以获得更好的聚类结果。提出基于改进变长聚类的多敏感属性概率 k-匿名算法,以提高数据可用性;提出融合 k-means与改进变长聚类算法的概率 k-匿名算法,采用多线程并行技术,在不降低信息损失度与匿名质量的前提下,提升处理大数据集的效率。实验结果表明,所提算法效率较高,其生成的匿名数据集具有较好的数据可用性。
数据发布、多敏感属性、概率 k-匿名、变长聚类、并行线程
TP309+.2(计算技术、计算机技术)
广西自然科学基金项目2011GXNSFA018152;广西研究生教育创新计划基金项目YCSZ2012007
2014-09-26(万方平台首次上网日期,不代表论文的发表时间)
共6页
2660-2665